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Rrólogo 


E1 lenguaje y los conceptos de la teoría de matrices y, más generalmente 
del Algebra Lineal han llegado también a aplicarse en las ciencias natu- 
rales y en las ciencias sociales. Pero eso no priva que el Algebra Lineal 
continúe teniendo su importancia extraordinaria en el tratamiento modemo 
de la geometría y el análisis. 

E1 propósito esencial de este libro es presentar cuidadosamente los 
principales temas del álgebra lineal e ilustrar la utilidad de la materia a 
través de una amplia variedad de aplicaciones. Aunque para el uso for- 
mal de este libro se supone que los alumnos han debido llevar un curso 
previo de cálculo, el contenido de los capítulos 6 y 7 no requieren más 
aparato matemático que el contenido en los estudios de ensenanza media 
superior en los cuales puede haber habido o no una iniciación al álgebra 
lineal. 

E1 libro está concebido de manera tal que permite ser utilizado en 
cursos de diferente duración. E1 material esencial del álgebra lineal (es- 
pacios veotoriales, transformaciones lineales y matrices, sistemas de ecua- 
ciones lineales, determinantes y diagonalización), se encuentra en los 
capítulos 1 al 5; los otros capítulos, que tratan las formas canónicas y 
espacios con producto interior, son completamente independientes y que 
se pueden estudiar en cualquier orden. Además, a lo largo del libro se 
encuentran diversas aplicaciones para áreas tales como ecuaciones dife- 
renciales, economía, geometría y física. Estas aplicaciones, claro está, 
no son imprescindibles para el desarrolîo matemático y pueden muy bien 
eliminarse a criterio del profesor. 

Hemos procurado que resultara posible abarcar la mayoría de los te- 
mas importantes de álgebra lineal en un curso semestral. Esta meta nos 
permitió desarrollar los temas más importantes con menos preliminares 
innecesarias, que en îos textos tradieionales. Nuestro tratamiento de la 
forma canónica de Jordan, por ejemplo, no requiere de la teoría de 
polinomios. La economía lograda en extensión permite desarrollar la 
mayor parte del libro (si se omiten muchas de las partes optativas y 
el análisis detallados de los determinantes), en un curso semestral de 
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4 horas semanales para aquellos estudiantes que hayan tenido conocimien- 
tos previos de álgebra li-neal. 

E1 capítulo 1 del libro presenta la teoría básica de espacios vectoriales 
de dimensiones finitas, subespacios, combinaciones lineales, dependencia 
e independencia lineal, bases y dimensión. E1 capítulo termina con una 
sección optativa en la cual se prueba la existencia de una base en los espa- 
cios vectoriales de dimensiones infinitas. 

En el capítulo 2 se desarrollan las transformaciones lineales y sus 
relaciones con las matrices; ahí se discute el espacio vacío y el límite de 
una transformación lineal, representaciones matriciales de una transfor- 
mación, isomorfismos y cambios de coordenadas. E1 capítulo se termina 
con las secciones opcionales sobre espacios duales y ecuaciones lineales 
diferenciales homogéneas. 

En el capítulo 3 se encuentran las aplicaciones de la teoría de espa- 
cios vectoriales y transformaciones lineales a los sistemas de ecuaciones 
lineales. Este importante tema lo hemos pospuesto intencionadamente 
para que se pueda presentar como consecuencia del material anterior. 
Este enfoque da pie al tema familiar de los sistemas lineales para aolarar 
la teoría abstracta, y permite evitar confusos cálculos de matrices en los 
capítulos 1 y 2. En esos capítulos habrá ejemplos ocasionales donde ten- 
dremos la oportunidad de solucionar sistemas de ecuaciones lineales (na- 
turalmente estos ejemplos no forman parte del desarrollo teorico). En la 
sección 1.4 se hallan las bases necesarias para ello. 

Los determinantes, tema del capítulo 4, tienen ahora mucho menos 
importancia que hace algún tiempo, para un curso abreviado es preferible 
tratarlos ligeramente, puesto que consideramos necesario dedicar más 
tiempo a los temas que se desarrollan del capítulo 5 al 7. De ahí que 
hayamos presentado dos altemativas en el capítulo 4: un desarrollo com- 
pleto de la teoría (seociones 4.1 a 4.4) y un resumen de los puntos 
importantes, indispensables para el resto de los capítulos (sección 4.5). 

En el capítulo 5 se desarrollan eigenvalores, eigenvectores y diago- 
nalización. Una de sus aplicaciones más importantes se encuentra en el 
cálculo de límite de matrices. Se ha incluido, sin embargo, una sección 
opcional sobre límite de matrices y cadenas de Markov, aunque la general 
mayoría de algunos de sus resultados requiera un conoeimiento de las 
formas canónicas de Jordan. Las secciones 5.4, 5.5 y 5.6 contienen in- 
formación sobre subespacios invariantes, el teorema de Cay'ley-Hamilton 
y del polinomio mínimo, respectivamente. 

Las formas canónicas se tratan en et capítulo 6, secciones 6.1 y 6.2 
desarrollan la forma Jordan y la sección 6.3 presenta la forma racional. 

Los espacios con producto interior son el tema del capítulo 7. La teo- 
ría matemática básica (productos interiores y el proceso de ortogonali- 
zación de Gram-Schmidt; las transformaciones del adjunto: normal, auto- 
adjunto, ortogonal y operadores unitarios; proyecciones ortogonales y el 
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teorema espectral) se desarrollan en las secciones 7.1, 7.2, 7.3, 7.5, 7.7 
y en la 7.9. En las secciones 7.4, 7.6, 7.8 y 7.10 se encuentran varias 
aplicaciones de la estructura del producto de interior. E1 capítulo ter- 
mina con un análisis de las formas cuadráticas y bilineales (sección 7.11). 

En el texto se encuentran también cinco apéndices. En los primeros 
cuatro se analizan respectivamente, conjuntos, funciones, camjx>s y núme- 
ros complejos con el fin de repasar las ideas básicas que se desarrollan 
a través del libro. En apéndice E sobre polinomios se utiliza primor- 
dialmente en los capítulos 5 y 6, en especial en la sección 6.3. Se ha 
preferido que esos apéndioes no se analicen en forma independiente sino 
hacer referencia a ellos según se requiera. 

E1 siguiente diagrama muestra la dependencia entre los capítulos del 
libro. 



Ahora unas palabras finales, que creemos necesarias respecto a nues- 
tra notación. Las secciones indicadas con un asterisco (*) son opcionales 
y pueden omitirse si así lo considera el profesor. Todo ejercicio indicado 
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por el símbolo (t) n ° es opcional; lo usamos para identificar un ejer- 
cicio que será citado posteriormente en el texto. 

Agradecemos a Douglas E. Cameron (University of Akron), Ed- 
ward C. Ingraham de (Michigan State University), David E. Kullman 
(Miami University), Carl D. Meyer, Jr. (North Carolina State University) 
y Jean E. Rubin (Purdue University) por haber revisado el manuscrito 
completo del texto, así como también a nuestros colegas y estudiantes 
por las sugerencias y estímulos recibidos durante el periodo en el que se 
estaba desarrollando el manuscrito de esta obra. También haeemos men- 
ción especial a Miss Jana Gehrke y a Marilyn Parmantie por su ayuda 
en el trabajo de mecanografía, así como a Harry Gaines, Ian List y al 
equipo de Prentice-Hall por su colaboración durante los procesos de pro- 
ducción. 

Normal, ìllinois Stephen H. Friedberg 

Arnold J. Insel 
Lawrence E. Spence 
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Espacios v^otorisl^s 


1.1 INTRODUCCION 

Muchas nociones físicas comunes, tales como las fuerzas, velocidades * y 
aceleraciones, involucran una magnitud (el valor de la fuerza, velocidad 
o aceleración) y una dirección. Cualquier entidad que involucre magni- 
tud y dirección se llama vector. Los vectores se representan por flechas 
en las que la longitud de ellas define la magnitud del vector, y la direc- 
ción de la flecha representa la dirección del vector. En la mayor parte 
de las situaciones físicas que involucran vectores, únicamente la magnitud 
y dirección del vector son significativas; consecuentemente, consideraremos 
a los vectores con la misma magnitud y dirección como iguales, indepen- 
dientemente de sus posiciones relativas. 

En esta sección se discutirá la geometría de los vectores, geometría que 
se deriva de los experimentos físicos que dan fe de la forma de inter- 
acción entre dos vectores. 

Muchas situaciones comunes sugieren que cuando dos vectores actúan 
simultáneamente en un punto, la magnitud del vector resultante (el vector 
obtenido sumando los dos vectores originales) no es necesariamente igual 
a la suma de las magnitudes de los dos vectores. Por ejemplo, un nadador 
que nada contra la corriente con una velocidad promedio de 3.2 km/h, 
siendo la velocidad de la corriente de 1.6 km/h, no avanzará con una 
velocidad promedio de 4.8 km/h. En este caso los movimientos del 
nadador y el de la corriente son contrarios y, por tanto, la velocidad pro- 
medio del nadador es únicamente de 1.6 km/h. Si, por el contrario, el 
nadador avanzara aguas abajo (a favor de la corriente), entonces su 
avance promedio sí sería de 4.8 km/h. 

Los experimentos muestran que los vectores se suman de acuerdo 
con la siguiente ley del paralelogramo. (Véase la fig. 1.1.) 


* La palabra “velocidad” está siendo utilizada* con su connotación científica, 
como una entidad que tiene magnitud y dirección. La magnitud de una velocidad 
(independientemente de la direceión del movimiento) se llama rapidez. 
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Ley del Paralelogramo para la Suma de Vectores. La suma de dos vectores x 
y y que actúan sobre un mismo punto P es el vector que, en el parcdelo- 
gramo que tiene a x y y por lados adyacentes, se representa por la 
diagonal que parte de P. 


Como los lados opuestos de un paralelogramo son paralelos y de igual 
longitud, el extremo Q de la flecha que representa a x + y también se 
puede obtener permitiendo que x actúe sobre P y luego permitiendo que 
y actúe sobre el extremo de x; o, de la misma manera, puede ser obtenido 
permitiendo que primero actúe y sobre P y posteriormente que x actúe 
sobre el extremo de y. De este modo, dos vectores x y y que actúan sobre 
un punto P pueden ser sumados “cola con cabeza”; esto es, se puede 
aplicar cualquiera de los veotores x o y en P y un vector que tenga la 
misma magnitud y dirección que el vector restante puede ser aplicado 
entonces en el extremo del primero —el extrenjo de este segundo vector 
es el extremo de x + y. 

La suma de vectores puede ser descrita algebraicamente mediante el 
uso de geometría analítica. En el plano que contiene a x y a y, introdúzr* 
case un sistema de coordenadas con P por origen y sea (a l9 a 2 ) cl extremo 
de x y (&!, h 2 ) el de y, Entonces, tal como lo muestra la figura 1.2, 
las coordenadas de Q , extremo de x + y, son (a x + b u a 2 + b 2 ). De aquí 
en adelante, cuando se haga referencia a las coordenadas del extremo de 
un vector, se considerará que el vector parte del origen. Mas aún, como un 
vector que principia en el origen queda completamente determinado por 



figura 1.2 
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]as coordenadas de su punto extremo, nos referiremos algunas veces al 
punío x en vez de al exîremo del vector x cuando x sea un vector que 
parte del origen. 

Además de la operación de suma de vectores existe otra op>eración 
natural que se puede realizar con los vectores —la longitud de un vector 
puede ser amplificada o reducida sin cambiar la dirección del vector. Esta 
operación, llamada multiplicación por un escalar, consiste en multiplicar 
un vector por un número real. Si el vector x está representado por una 
flecha, se tiene que para cualquier número real t > 0 el vector tx que- 
dará representado por una flecha que tiene la misma dirección de la 
flecha que representa a x pero su longitud será t veces mayor. Si / < 0, 
el vector tx quedará representado por una flecha cuya dirección sea 
opuesta a la de x y con una longitud de | / J veces la longitud de la flecha 
que representa a jc. Dos vectores no nulos x y y se denominan paralelos 
si y = tx para cualquier número real t no nulo. (Así, los vectores no nulos 
con direcciones iguales u opuestas, son paralelos.) 

Para describir algebraicamente la multiplicación por escalares, intro- 
dúzcase de nuevo un sistema de coordenadas en un plano que contenga 
al vector jc tal que jc parta del origen. Si el extremo de x tiene por 
coordenadas a (a u a>), entonces puede mostrarse fácilmente que Ias 
coordenadas del extremo de tx son (ta u ta 2 ). (Véase el ejercicio 5.) 

Las descripciones algebraicas de la suma de vectores y de la multi- 
plicación de vectores por escalares en un plano, implican las siguientes 
propiedades para vectores arbitrarios jc, y, y z y números reales arbitra- 
rios a y b: 

1. jc-hy = y-fjc. 

2. (x + y) + z - x + (y + z). 

3. Existe un vector llamado 0 tal que jc + 0 = x para todo vector x. 

4. Para cada vector jc existe un vector y tal que x 4- y = 0. 

5. Ijc — jc. 

6. (ab) x = a(bx). 

7. a(x -f y) = ax -f ay. 

8. (a + b)x “ ajc + bx. 

Argumentos semejantes a los antes mencionados muestran que estas 8 
propiedades, así como las interpretaciones geométricas de suma de vecto- 
res y multiplicación por escalares, son válidas para vectores que actúan 
en el espacio y no sólo en un plano. Utilizaremos estos resultados para 
escribir las ecuaciones de rectas y planos en el espacio. 

Considérese primero la ecuación de una recta en el espacio que pasa 
por dos puntos distintos P y Q. Sea O el origen de un sistema de coorde- 
nadas en el espacio y sean u y v los vectores que parten de O y terminan 
respectivamente en P y Q. Si w es el vector que principia en P y termina 
en Q , la suma “cabeza con cola” muestra que u + w — v y por tanto 
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w = v — u donde — u representa al vector ( —1 )u. (Véase la fig. 1.3 
en donde el cuadrilátero OPQR es un paralelogramo.) Como un múltiplo 
de escalar w es paralelo a w, pero posiblemente de una longitud diferente 
a w , cualquier punto de la recta que une a P y Q se puede obtener como 
el extremo del vector que principia en P y que tiene la forma tw para 


P 



figura 1.3 


algun número real t. Recíprocamente, el extremo de cada vector de la 
forma tw que principia en P yace en la línea que une a P y Q. Luego, 
una ecuación de la recta que pasa por Py Q ts x — u + r>t> = u + t(v—u ), 
donde t es un número real y x es un punto arbitrario de la recta. Véase 
también que el extremo R del vector v - u de la fig. 1.3 tiene coorde- 
nadas iguales a la diferencia de las coordenadas de Q y P. 

Ejemplo. Encontremos la ecuación de la recta que pasa por los pun- 
tos P y Q de coordenadas ( — 2, 0, 1) y (4, 5, 3), respectivamente. 
E1 extremo R del vector que parte del origen y que tiene la misma direc- 
ción que el vector que principia en P y termina en Q, tiene como coor- 
denadas (4, 5, 3) — ( — 2, 0, 1) = (6, 5, 2). Lue'go, la ecuación buscada 
será: 

(-2, 0, 1) + t( 6, 5, 2). 

Ahora, sean P, Q y R tres puntos no colineales en el espacio. Estos 
puntos determinan un plano único cuya ecuación puede ser encontrada 
mediante el uso de nuestras anteriores observaciones sobre vectores. Sean 
u y v los vectores que parten de P y terminan, respectivamente, en Q y R. 
Obsérvese que cualquier punto del plano que contenga a P, Q y R es 
el extremo S de un vector x que principia en P y tiene la forma hu + Uv 
para cualquier par de números reales t x y u. E1 extremo de t x u será el 
punto de interseccion de la recta que pasa por P y Q con la recta que 
pasa por S y es paralela a la recta que pasa por P y R. (Véase fig. 1.4.) 
Un procedimiento análogo permitirá localizar Uv. 
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Mas aún, para cualquier par de números reales t x y / 2 , Uu H- t 2 v es un 
vector ubicado en el plano que contiene a P, Q y R. Por lo tanto, la 
ecuaeión del plano que contiene a P, Q y R es 

X = p -f f iU -f f 2 y ^ 

donde h y 4 son números reales arbitrarios y x es un punto cualquiera 
del plano. 

Ejemplo. Sean P, Q y R puntos de coordenadas (1, 0, 2), ( — 3, —2, 4) 
y (1, 8, —5), respeetivamente. E1 extremo del vector que parte del origen 
y tiene la misma longitud y dirección que el vector que va de P a Q es 
( — 3, —2, 4) — (1, 0, 2) = (—4, —2, 2); de la misma forma, el 
extremo del vector que parte del origen y tiene la misma longitud y 
dirección que el veotor que va de P a R es (1, 8, —5) — (1, 0, 2) = 
= (0, 8, —7). Luego, la ecuación del plano que contiene a los tres 
puntos dados es 

x = (1, 0, 2) 4- *i( —4, -2, 2) + 4(0, 8, -7). 

Cualquier estructura matemática que posea las ocho propiedades de 
la página 3 se llama “espacio vectorial”. En la sección siguiente defini- 
remos formalmente un espacio vectorial y consideraremos muchos ejem- 
plos de espacios vectoriales distintos a ìos antes mencionados. 


EJERCICIOS 


1. Determinar si los vectores que parten del origen y terminan en los siguientes 
pares de puntos son paralelos. 

(a) (3, 1, 2) y (6, 4, 2) 

(b) (-3, 1, 7) y (9, -3, -21) 

(c) (5, -6, 7) y (-5, 6, -7) 

(d) (2, 0, -5) y (5, 0, -2) 




6 Espacios vectoriales 

2 . Encontrar las ecuaciones de Ias rectas que pasan por los siguientes pares 
de puntos en el espacio. 

(a) (3, -2, 4) y (-5, 7, 1) 

(b) (2, 4, 0) y (-3, -6, 0) 

(c) (3, 7, 2) y (3, 7, -8) 

(d) (-2, -1, 5) y (3, 9, 7) 

3. Encontrar las ecuaciones de los planos que contienen los siguientes puntos 
en el espacio. 

(a) (2, -5, - 1 ), (0, 4, 6) y (-3, 7, 1) 

(b) (3, -6, 7), (-2, 0, -4) y (5, -9, -2) 

(c) (-8, 2, 0), (1, 3, 0) y (6, —5, 0) 

(d) (1, 1, 1), (5, 5, 5) y (-6, 4, 2) 

4. ^Cuáles son las coordenadas del vector 0 en el plano Euclidiano que satis- 
facen la condición 3 de la página 3. Demostrar que esta selección de coorde- 
nadas satisface la condición 3. 

5. Demostrar que si el vector x parte del origen del plano Euclidiano y termina 
en el punto de coordenadas (a u a.), entonces el vector íx que parte del 
origen termina en el punto de coordenadas (ta u ta ,). 

6 . Demostrar que las diagonales de un paralelogramo se bisectan. 


7.2 ESPACIOS VECTORIALES 

Debido a que entidades tan diversas como las fuerzas que operan en un 
plano y los polinomios con coefidentes reales permiten definiciones natu- 
rales de suma y multiplicación por escalares que poseen las propiedades 
1 a 8 de la página 3, es evidente que se deban abstraer dichas propieda- 
des en la siguiente definición. 


Definición. Un espacio vectorial (o espacio lineal) V sobre un campo * F 
consiste de un conjunto en el que están definidas dos operaciones (llama- 
das adición y multiplicación por escalares, respectivamente), tal que para 
cualquier par de elementos x y y en V exista un elemento único x + y 
en V, y para cada elemento a en F y cada elemento x en V exista un 
elemento único ax en V, de manera que se cumplan las siguientes con- 
diciones: 


* Ver apéndice C. Sin embargo, con muy pocas excepciones, el Iector puede 
ìnterpretar Ja palabra “campo ,, como “campo de los números reales” (denotado 
por R) o “campo de los números complejos” (denotado por C). 



Espacios vectoriales 


7 


(VS 1) Para toda x, y en V, x + y ~ y + x (conmutatividad de la 
adiciórt). 

(VS 2) Para toda x, y, z en V, (x + y) 4- z = x + (y + z) (aso- 
ciatividad de la adición). 

(VS 3) Existe un elemento en V llamado 0 tal que x + 0 — x 
para toda x en V. 

(VS 4) Para cada elemento x en V, existe un elemento y en V tal 
que x + y = 0. 

(VS 5) Para cada eîemento x en V, lx = x. 

(VS 6) Para cada par a, b de elementos en F y cada eîemento x 
en V, (ab)x = a(bx). 

(VS 7) Para cada elemento a en F y cada par de elementos x, 
y en V, a(x + y) = ax + ay. 

(VS 8) Para cada par de elementos a, b en F y cada elemento x 
en V, (a + b)x = ax + bx. 

Los elementos x + y y ax se denominan, respectivamente, suma de x 
y y y el producto de a y x. 

Los elementos del campo F se Ilaman escalares y los elementos del 
espacio vectorial V se llaman vectores. E1 lector no debe confundir este 
uso de la palabra “vector” con la entidad física tratada en la sección 1.1; 
ahora, la palabra “vector” se utilizará para describir cualquier elemento 
de un espacio vectoriai. 

Frecuentemente, un espacio vectorial será tratado en el texto sin men- 
cionar explicitamente su campo de escalares. E1 lector cuidará de recordar, 
sin embargo, que todo espacio vectorial debe considerarse como un espa- 
cio vectorial sobre un campo, el que se denotará por F. 

En el resto de la seccion introduciremos diversos ejemplos imjx>rtantes 
de espacios vectoriales que serán estudiados a través del texto. Obsérvese 
que al describir un espacio vectorial no sólo es necesario especificar los 
vectores, también las operaciones de suma y multiplicación por escalares. 

Un objeto de la forma (a u . . . , a n ), donde los valores o entradas 
a i son elementos de un campo F, se denomina n-dimensional * con 
valores de F. Dos rc-dimensionales (a u . .. , On) y (b u . . . ,b n ) se defi- 
nen como iguales si y sólo si a^ = b, para i = 1 , 2, . . . , n. 

Ejemplo 1. E1 espacio vectorial F n de n-dimensionales con valores de 
un campo F. 

E1 conjunto de todas las n-dimensionales con valores de un campo F 
forma un espacio vectorial, que denotaremos por F n , bajo las operaciones 
de suma y multiplicación coordinada (elemento a elemento); esto es, si 
x — (a u . . . , a n ) £ F n , y — (b u . .. , b n ) Ç_ F n , y c £ F, entonces 

x + y = (#i + b u . . . , a n + b n ) y cx = (ca u . . . , ca n ). 

* N. del T. En algunos libros de álgebra lineal a los /ì-dimensionales se 
les da el nombre de rc-adas, n-uplas, /î-4uplas y otros más, pero aquí preferiremos 
la citada denominación. 
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Por ejemplo, en R 4 


(3, -2, 0, 5) + (-1, 1, 4, 2) - (2, -1, 4, 7) 


y 


-5(1, -2, 0, 3) = (-5, 10, 0, —15). 


Los elementos de F n a menudo se escribirán como veciores columna: 


/a,] 

W 


en vez de como vectores renglón ( a u . . . , a^). Puesto que un 1-dimen- 
sional con valor de F puede ser visto como elemento de F, escribiremos 
F en vez de F 1 para el espacio vectorial de los 1-dimensionales de F. 

Una matriz de m x rt con valores de un campo F es un arreglo rec- 
tangular de la forma 


l a 11 a M ••• a in\ 
a 21 a 22 • • • a 2n 

a m2 • • • a mJ 


donde cada elemento a i} (ì < i < m, 1 < j < n) pertenece a F. Los ele- 
mentos a il9 a i2 , . . . , a in de la matriz anterior forman el i-ésimo renglón 
de la matriz y se considerarán a menudo como un vector renglón en F n , 
mientras que los elementos a lh a 2h ... , Omj forman la columna j-ésima 
de la matriz y serán a menudo considerados como un vector columna 
en F m . La matriz de m x n en la que cada elemento es igual a 0 se deno- 
mina matriz cero. 

En este libro escribiremos las matrices con letras mayúsculas cursivas 
(p. ej., A, B y C) y denotaremos al elemento de la matriz A ubicado 
en el renglón i y la columna / por A ih Además, si el número de renglones 
es igual al número de columnas de una matriz, ésta se denominará cua- 
drada. 

Dos matrices de m x n, A y B se definen como iguales si y sólo 
si sus elementos correspondientes son iguales; esto es, si y sólo si 
A {j ~ B iŷ para 1 < i < m y 1 < j < n. 
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s Ejemplo 2. E1 espacio vectorial M mxn (F) de matrices m x n con valo- 
res de un campo F. 

E1 conjunto de todas las matrices d t m x n con elementos de un cam- 
po F es un espacio vectorial, que denotaremos por M mxn (F), bajo las 
siguientes operaciones de suma y multiplicación por escalares: para A , 
B £ M mxn (F) y c£F, 

(A + B)ìj = Aìj + Bij y (cA)ìj = 

Por ejemplo 



en M ;2 x3 (F). 

Ejemplo 3. E1 espacio vectorial ^(5*, F) de todas las funciones de un 
conjunto 5 en un campo F. 

Sea S un conjunto no vacío y F cualquier campo, y sea J(S, F) el 
conjunto de todas las funciones que van de S a F. Dos elementos f y g 
en 3(S, F) se definen como iguales si f(s) = g(s) para cada s £ S. 
E1 conjunto 7(S, F) es un espacio vectorial bajo las operaciones de 
suma y multiplicación por escalares definidas para /, g , £ 7(5, F) y 
c £ F por 

(/ + g)(s) = f(s) + g(s) y (cf)(s) = c[f(s ) ] 

para cada s £ 5. Nótese que éstas son las operaciones normales de suma 
y producto por escalares utilizadas en cálculo. 

Un potinomio con coeficientes de un campo F es una expresión de 
la forma 


f(x) = OnX n + O n ^ 1 X n ~ 1 + ... + OyX + tf 0 , 

donde n es un entero no negativo y a^, . . . , Oq son elementos de F. 
Si /(x) = 0, esto es, si = . . . = a 0 = 0, entonces f(x) se llama el 
polinomio cero y se dice que el grado de f(x) es — 1; de otra forma, 
se define el grado de un polinomio como el mayor exponente de x que 
aparece en la representación 


f(x) - OnX n + a^jx*- 1 + ... + a 0 
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correspondiente a un coeficiente no nulo. Nótese que los polinomios de 
grado cero son funciones de la forma f(x ) — c para algún escalar c no 
nulo. 

Dos polinomios f(x) y g(x) son iguales si y sólo si tienen el mismo 
grado y los coeficientes de potencias iguales son iguales. 

Cuando F es un campo que contiene un número infinito de elementos, 
normalmente consideraremos un polinomio con coeficientes de F como 
una función de F en F. En este caso, el valor de la función 

f(x) m a n x n + an-ix n -' + . . . + a 0 

en c£ F es el escalar 

f(c) = a n c n + a n -- ì d n ' 1 + . . . + a 0 . 

Aquí, es posible utilizar cualquiera de las dos notacíones / o f(x) para 
la función polinomial 

f(x) = a n x n + a n -,x n ~' + . . . + a t >. 

Ejemplo 4. E1 espacio vectorial P (F) de todos los polinomios con coefi- 
cientes de un campo F. 

E1 conjunto de todos los fK)linomios con coeficientes de un campo F 
es un espacio vectorial, que denotaremos por P(F), bajo las siguientes 
operaciones: 

Para 


y 


f(x) = a n x n + On-iX*- 1 + ... + a t > 
g(x) = b n x n + bn^x^ + ... + b 0 


en Pí/ 7 ) y c(F, 

(/ + g)(jc) = (a. n + b n )x n + (an^ + b n ^)x 11 ' + . . . + (a 0 + b 0 ) 

y 

(cf) (x) = ca n x n + can-iX*- 1 + . . . + ca () . 

Veremos en el ejercicio 21 de la sección 2.4 que el espacio vectorial 
que abajo se define es esencialmente el mismo que P(F). 


Ejemplo 5. E1 espacio de todas las sucesiones finitas no nulas en un 
campo F. 
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Sea F cualquier campo. Una sucesión en F es una función <r de los 

enteros positivos en F. Como es usual, Ia sucesión o- tal que <r(n) — a^ , 

se escribirá como { a n }. E1 espacio vectorial V de todas las sucesiones 
finitas no nulas en F está integrado por todas las sucesiones {On} en F 
que solamente tienen un número finito de términos no nulos On. Si { a n } 
y { b n } son sucesiones en V y / £ F, entonces {a n } + {b n } es aquella 

sucesión {c n } en V tal que c n = + b n (n — 1, 2, . . .), y /{an} es 

aquella sucesión { d n } en V tal que d n = tan(n — 1, 2, . . .). 

Nuestros dos ejemplos siguientes contienen conjuntos en los que están 
definidos una suma y un producto por escalares pero no se trata de 
espacios vectoriales. 

Ejemplo 6. Sea S — {(íïi, a 2 ): a ly a 2 Ç_ R}. Para (a l9 a 2 )> (b u b 2 ) £ S 
y cÇ_ R, se definen 


(a u a>) + (b u b l2 ) = (a^ + b u a 2 — b 2 ) y c(ai, 02 ) = (ctfi, ozh). 

Como (VS 1), (VS 2) y (VS 8) no se cumplen, S no es un espacio 
vectorial bajo estas operaciones. 

Ejemplo 7. Sea S como en el ejemplo 6. Para (a u a 2 ), (b u b 2 ) £ S y 
c£ R, definimos 

(a u a>) + (b u b 2 ) = (a x + b u Q) y c(a u a 2 ) = (ca u 0). 

Luego, bajo estas operaciones, S no es un espacio vectorial pues (VS 3) 
(y por tanto (VS 4)) y (VS 5) fallan. 

Esta sección concluirá con algunas de las consecuencias elementales 
de Ia definición de un espacio vectorial. 

Teorema 1.1 (Ley de cancelación para la suma vectorial). Si x, y y z son 
elementos de un espacio vectorial V tal que x + z = y + z, entonces 

x = y. 

demostración. Existe un elemento v en V tal que z + v = 0 (VS 4). 
Luego, x = x + 0 = x-t(z + v) = (x + z) + v=(y + z)+v = y 
+ (z + v)=y + 0 — y por (VS 2) y (VS 3). ■ 

Corolario 1. Ei vector 0 descrito en (VS 3) es único. 
demostración. Ejercicio. 

Corolario 2. El vector y descrito en (VS 4) es único. 

DEMOSTRACiÓN. Ejercicio. 
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E1 vector 0 descrito en (VS 3) se llama vector cero de V, y el vec- 
tor y descrito en (VS 4) (esto es, el vector único tal que x + y = 0) 
se llama el inverso aditivo de x y se denota por —x. 

E1 siguiente resultado contiene algunas de las propiedades elementales 
de la multiplicación por escalar. 

Teorema 1.2 En cualquier espacio vectorial V, son verdaderos los siguientes 
enunciados: 

(a) Ox — 0 para toda x Ç_ V. 

(b) ( —a)x = — (ax) para toda aÇ F y toda xÇ V. 

(c) aO = 0 para toda a Ç_ F. 

demostración: 

(a) Por (VS 8), (VS 1) y (VS 3) se tiene que 

Ojc + Ojc = (0,+ 0)jc = Ojc = 0 + Ojc. 

Por tanto, Ojc = 0 por el Teorema 1.1. 

(b) E1 elemento — (ax) es el único elemento de V tal que 
ax + [— (ax)] = 0. Si ax + (— a)x = 0, el corolario 2 anterior impli- 
caría que (—a)x——(ax). Pero por (VS 8), ax + (— a)x = [a + 
+ (—a)] x = 0*, y así ax + (— a)x = Ojc = 0 por (a). Entonces, 
(—a) x = — (ax). 

La demostración de (c) es semejante a la demostración de (a). ■ 

EJERCICIOS 

1. Determinar si las siguientes expresiones son falsas o verdaderas. 

(a) Todo espacio vectorial contiene un vector cero. 

(b) Un espacio vectorial puede tener más de un vector cero. 

(c) En cualquier espacio vectorial ax = bx implica que a = b. 

(d) En cualquier espacio vectorial ax = ay implica que jc = y. 

(e) Un elemento de F n puede ser considerado como un elemento de 
M inxl (F). 

(f) Una matriz de m x n tiene m columnas y n renglones. 

(g) En P(F) sólo se pueden sumar polinomios del mismo grado. 

(h) Si / y g son polinomios de grado n, entonces / + g es un polinomio 
de grado n. 

(i) Si / es un polinomio de grado n y c es un escalar no nulo, entonces 
cf es un polinomio de grado n. 

(j) Un elemento no nulo de F puede considerarse como un elemento de 
P(F) de grado 0. 
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(k) Dos funciones en ?(S, F ) son iguales si y sólo si toman los mismos 
valores en cada punto de S. 

2 . Escribir el vector nulo de AA 3x4 (F). 

3. Si 



^cuáles son M 13 , M Z1 y M^? 

4. Realizar las operaciones indicadas. 

(a) P 5 -3\ / 4 -2 5| 

0 l) y—5 3 2 ) 

(b) /-6 4\ /7 —5\ 

( î - i) + (; ~i) 


(c) 4/2 5 —3\ 

v 0 7 ; 



(e) (2X 4 - Ix 3 + 4x + 3) + (8x 3 + 2 a: 2 - 6jc + 7) 

(f) (- 3x* + lx 2 + 8jc - 6) + (2* 3 - 8jc + 10) 

(g) 5(2jc 7 - ójc 4 + 8jc 2 - 3jc) 

(h) 3 (jc 5 - 2jc 3 + 4jc + 2) 

Los Ejercicios 5 y 6 muestran por qué las definiciones de suma y multiplica- 
ción por escalares de matrices (como se definen en el ejemplo 2) son las ade- 
cuadas. 

5 . Richard Gard (Efectos de los castores en las truchas en Sagehen Creek, 
Califomia. J. Wildlife Management, 25, 221-242) reporta el siguiente núme- 
ro de tmchas que atravesaron las represas de castores en Sagehen Creek: 


Cruces a contracorriente 

Otono Primavera Verano 


Trucha arroyo 
Trucha arcoiris 
Trucha café 


8 

3 

3 


3 

0 

0 


1 

0 

0 
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Cruces a favor de la corriente 



Otono 

Primavera 

Verano 

Trucha arroyo 

9 

1 

4 

Trucha arcoiris 

3 

0 

0 

Trucha café 

1 

1 

0 


Registrar Ios cruces a contracorriente y a favor de la corriente como 
datos en dos matrices de 3 x 3 y verificar que la suma de las dos matri- 
ces da el número total de cruces (a contracorriente y a favor) categorizada 
por especie de trucha y por estación. 

6 . Al final de mayo, un almacén de muebles tenía el siguiente inventario: 



Americano 
tradicional Espanol 

Medite- 

rráneo 

Danés 

Conjuntos de sala 

4 

2 

1 

3 

Conjuntos de alcoba 

5 

1 

1 

4 

Conjuntos de comedor 

3 

1 

2 

6 


Registrar estos datos como una matriz M de 3 x 4. Con el fin de prepa- 
rarse para su venta de junio, el almacén decidió duplicar su inventario de 
cada uno de los rubros anteriores. Suponiendo que nada de la mercancía 
en inventario se vende hasta que los pedidos de muebles adicionales lleguen, 
se verifica que el inventario disponible después de recibir el pedido estará 
dado por la matriz 2M. Si el inventario al final de junio queda dado por 
la matriz 

/ 5 3 1 2 \ 

^= 6 2 1 5 . 

\l 0 3 3/ 

interpretar 2M — A. ^Cuántos conjuntos se vendieron durante la venta de 
junio? 

7. Sea S={0, 1) y F = R, el campo de los números reales. En 7(5, R), 
demostrar que/ = gy/ + g= /i donde f(x ) = 2jc + 1, g(x ) = 1 + 4x - 
-2x\ y h(x) = 5* + 1. 

8. Demostrar que en cualquier espacio vectorial V, (a + b) (x + y) = ax + 
+ ay + bx + by para toda x, y Ç V y cualquier a, b Ç_ F. 

9. Demostrar los Corolarios 1 y 2 del Teorema 1.1 y el Teorema 1.2(c). 

10. Sea V el conjunto de todas las funciones diferenciales de valores reales 
definidas sobre la recta de los reales. Demostrar que V es un espacio vecto- 
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rial bajo las operaciones de suma y multiplicación por escalares definidas 
en el ejemplo 3. 

Sea V — {0} que conste de un único vector 0 y defínase 0 + 0 — 0 y 
c0 ~ 0 para cada c de F. Demostrar que V es un espacio vectorial sobre 
F(V se llama el espacio vectorial cero). 

Una función de valor real definida sobre la recta de los reales se llama 
furrción par si f(~x) = f(x) para todo número real x. Demostrar que el 
conjunto de ias funciones par definidas en Ia recta de los reales, con las 
operaciones de suma y multiplicación por escalares definidas en el ejem- 
plo 3, es un espacio vectorial. 

Sea V el conjunto de pares ordenados de números reales. Si (a u a 2 ) 
y (b u b>) son elementos de V y c es un elemento de F, se definen 

(a u a>) + (fri, b>) = (a x + b u a>b>) y c(a u a>) — (ca u a>). 

lEs V un espacio vectorial bajo esas operaciones? Verifique su respuesta. 

Sea V = {(a u . . . , a^): a t £ C para i — 1, 2, ... , n). ^Es V un espacio 
vectorial sobre el campo de los números reales con las operaciones de suma 
y multiplicación con correspondencia de elementos? 


Sea V = {(a u . . . , a n ): a { £ R para i = 1, 2, ... , n). ^Es V un espacio 
vectorial sobre el campo de los números complejos bajo las o{>eraciones de 
suma y multiplicación con correspondencia de elementos? 


Sea V = {(a u a>) : a u a> £ R). Para (a u a>), (b u b 2 ) £ V y c£ R, defí- 
nase 

(a u a>) + (b u b 2 ) = (a x + fr„ a> + b>) 


f(0, 0) 


si c = 0 


c(a u a>) — \ ( ci 2 \ . . A 

\[ca u — I si c^O. 

^Es V un espacio vectorial bajo estas operaciones? Justifiqi^e su respuesta. 

Sea V = {(a u a 2 ): a u a>£ C). Para (a u a 2 ), (b u b 2 ) £ V y c£ C, de- 
fínase 


(a u a>) + (b u b 2 ) — (a x + 2 b u a> + 3 b 2 ) y c(a x , a 2 ) — (ca x , ca 2 ). 

^Es V un espacio vectorial bajo estas oj>eraciones? Justifique su respuesta. 
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18. Sea V — {(a u a 2 ): a u a 2 Ç. F), donde F es un campo arbitrario. Defí- 

nase la suma de los elementos de V elemento a elemento, y para c£ F 
y (a u a 2 ) £ V, defínase 

c(a u a>) = (a u 0). 

^Es V un espacio vectorial bajo estas opyeraciones? Justifique su respuesta. 

1.3 SUBESPACIOS 

Normalmente, en el estudio de cualquier estructura algebraica es intere- 
sante examinar subconjuntos que tengan la misma estructura que el con- 
junto que esté siendo considerado. Así, la noción apropiada de subestructu- 
ra para espacios vectoriales se introduce en esta sección. 

Definición. Un subconjunto W de un espacio vectorial V sobre un campo F 
se llama un subespacio de V si W es un espacio vectorial sobre F, bajo 
las operaciones de suma y multiplicación por escalares definidas en V. 

En cualquier espacio vectorial V, es de hacer notar que V y {0} son 
subespacios. Este últi-mo se denomina el subespacio cero de V. 

Afortunadamente, no es necesario verificar todas las condiciones sobre 
espacios vectoriales con el objeto de demostrar que un subconjunto W 
de un espacio vectorial V es en realidad un subespacio. Como se sabe, 
las condiciones (VS 1), (VS 2), (VS 5), (VS 6), (VS 7) y (VS 8) se 
satisfacen para los elementos de V, las cuales, automáticamente se cumplen 
también para los elementos de un subconjunto V. Entonces, un sub- 
conjunto W de V es un subespacio de V si y sólo si las siguientes cuatro 
condiciones se satisfacen: 

1. x + y £ W siempre y cuando x £ W y y( W. 

2. ax £ W siempre que a £ F y x £ W. 

3. E1 vector cero de V pertenece a W. 

4. E1 inverso aditivo de cada elemento de W pertenece a W. 

En realidad, la condición 4 es redundante, como lo muestra el siguiente 
teorema. ^ 

Teorema 1.3 Sea V un espacio vectoriaî y W un subconjunto de V. Entonces, 
W es un subespacio de V si y sálo si se satisfacen las tres condiciones 
siguientes: 

(a) 0ÇW. 

(b) x + y £ W siempre que x £ W y y £ W. 

(c) ax £ W siempre que a( F y x £ W. 
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demostración. Si W es un subespacio de V, entonces W es un espacio 
vectorial bajo las operaciones de suma y multiplicación por escalares defi- 
nidas en V. Tenemos entonces que se cumplen las condiciones (b) y (c), 
y existe un elemento 0' Ç W tal que jc + 0' = jc para toda xÇW. Pero 
también x -f 0 = x, y por tanto 0' — 0 por el Teorema 1.1. Luego enton- 
ces, también se satisface la condición (a). 

Recíprocamente, si se satisfacen las condiciones (a), (b) y (c), la 
exposición que precede a este teorema muestra que W puede ser un 
subespacio de V si el inverso aditivo de cada elemento de W j>ertenece 
a W. Pero si xÇ W, entonces ( — l)x pertenece a W por la condición 
(c), y ~x = ( —l)x por el Teorema 1.2. De aquí que W sea un subes- 
pacio de V. | 

E1 teorema anterior proporciona un método sencillo para determinar 
si un subconjunto dado de un espacio vectorial es o no realmente im 
subespacio. En general, este resultado es el que se emplea para demostrar 
que un cierto subconjunto es un subespacio. 

La transpuesta M l de una matriz M de m x n es la matriz d e n x m 
obtenida a partir de M mediante el intercambio de renglones con colum- 
nas; esto es (Af*)i/ = Af ;i . Por ejemplo, 



Una matriz simétrica es una matriz M tal que M l = M. Evidentemente, 
una matriz simétrica debe ser cuadrada. E1 conjunto W de todas las matri- 
ces simétricas en M tnxn (F) es un subespacio de M nxn (F) ya que se satis- 
facen las condiciones del Teorema 1.3: 

(a) La matriz cero es igual a su transpuesta y, por tanto, pertene- 
ce a W. 

Puede probarse fácilmente que para matrices A y B y para escalares a 
y b cualesquiera, (aA + bB) f = aA f + bB f . (Ver el ejercicio 3.) Usando 
este hecho, se pueden establecer fácilmente las condiciones (b) y (c) 
del Teorema 1.3 de la manera siguiente: 

(b) Si A Ç W y B Ç W, entonces A = A* y B = B f . Ahora bien, 
(A + B) f — A x + B Ỳ — A + 5, de manera que A + B Ç W. 

(c) Si £ W, entonces = A. Luego, para toda aÇ F, (aA) f = 
— a/L = Y así Ç W. 

Los siguientes ejemplos proporcionan más ilustraciones del concepto 
de subespacio. Los primeros tres son particularmente importantes. 
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Ejemplo 8. Las matrices diaganales en hA nxrì (F). 

Sea M una matrìz de n x n. La diagonal (principal) de M consta de 
los términos M lu M z .>, . . . , M nn . Una matriz D de n x n se llama matriz 
diagonal si todos los valores que no se encuentren sobre la diagonal de D 
son nulos, esto es, si Z) i; = 0 para toda i^j. E1 conjunto de todas las 
matrices diagonales en M in><îl (F) es un subespacio de M nxn (F). 

Ejemplo 9. Los polinomios de grado menor o igual a n. 

Sea n un entero no negativo y sea P , n (F) un conjunto que consista 
de todos los polinomios en P(F) que tengan grado menor o igual a n. 
(Nótese que el polinomio nulo es un elemento de P n (F) pues su grado 
es —1.) Luego entonces, P n (F) es un subespacio de P(F). 

Ejemplo 10. Las funciones continuas de valores reales definidas en el 
eje de los reales R. 

E1 conjunto C (R) formado por todas las funciones continuas de valor 
real definidas en R es un subespacio de F(R, R), donde J(R, R) es tal 
como se definió en el ejemplo 3. 

Ejemplo 11. La traza de una matriz M de n x n, denotada por tr(AÍ), 
es la suma de los valores de M ubicados en la diagonal; esto es, tr(M) 

= Mu 4- AÍzl» + . . . + M nn . E1 conjunto de todas las matrices de n x n 
que tienen una traza igual a cero es un subespacio de M nxln (F). (Ver el 
ejercicio 6.) 

Ejemplo 12. E1 conjunto de matrices en M mxn (F) que únicamente ten- 
gan elementos no negativos no es un subespacio de M mxn (F) ya que no 
se cumple la condición (c) del Teorema 1.3. 

Los dos teoremas siguientes proporcionan métodos para formar subes- 
pacios a partir de otros subespacios. 

Teorema 7.4 Cualquier intersección de subespacios de un espacio vectorial V 
es un subespacio de V. 

demostración. Sea 6 un conjunto de subespacios de V y sea W la inter- 
sección de todos los subespacios en C. Como cada uno de los subespacios 
contiene al vector cero, 0 Ç_ W. Sean aÇ F y x, y elementos de W; enton- 
ces x y y son elementos de cada subespacio en C. De aquí concíuimos que 
x -f y y ax son elementos de cada subespacio en C (porque la suma de 
vectores en un subespacio y el producto de un escalar y un vector del 
subespacio, ambos pertenecen a ese subespacio). Entonces x + y Ç W 
y ax Ç W; luego entonces W es un subespacio de acuerdo con el Teore- 
ma 1.3. ■ 
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Habiendo demostrado que la intersección de subespacios es un subes- 
pacio es lógico considerar la cuestión de si la unión de subespacios es 
o no un subespacio. Se puede ver fácilmente que la unión de subespacios 
debe satisfacer las condiciones (a) y (c) del Teorema 1.3 pero no nece- 
sariameníe satisface la condición (b). De hecho, se puede demostrar de 
inmediato (ver ejercicio 18) que la unión de dos subespacios es un subes- 
pacio si y sólo si uno de los subespacios es un subconjunto de otro. Es 
normal, sin embargo, pensar que debería de existir un método para combi- 
nar ambos subespacios Wj y W. para obtener un subespacio mayor (o 
sea, uno que contenga a W t y a W 2 ). Como sugerimos anteriormente, 
la clave para encontrar tal subespacio es la condición (b) del Teorema 
1.3. Esta observación sugiere que debiéramos considerar la “suma” de 
dos subespacios (como se define a continuación). 

Definición. Si Sj y S 2 son dos subconjuntos no vacíos de un espacio vectorial V, 
entonces la suma de Sj y S 2 , que se expresa como S, + S 2 , es el conjunto 
{x + y: x Ç S, y y Ç S 2 }. La suma de cuaîquier número finito de subcon - 
juntos no vacíos de V, $ u . .. , S n , se define análogamente como el con - 
junto 


Sj + . .. + S n = {xi + . .. + x n : Xi € S f para i = 1, 2, . .. , n}. 

Teorema 1.5 Si W x y W 2 son subespacios de un espacio vectorial V, entonces 
Wi + W 2 es un subespacio de V. 

demostración. Sean W, y W 2 subespacios de V. Como 0 Ç W, y 
0 Ç W„ 0 = 0 + 0Ç W,+ W 2 . Sea a£ F y x , y£ W, + W c ; entonces 
existirá x u y x Ç_ W, y x„ y 2 Ç W 2 tales que x = x^ + x 2 y y = y x + y 2 . 
Ahora bien, 


x + y (*i "b x 'i) “b (+i “h Js) — (-Ti + yi) + ( x 2 + y 2 ) 


es un elemento de W, + W 2 ya que x Y + y x Ç W, y * 2 + y, Ç W,\ y 
ax = a(x Y + x 2 ) = aXi + ax 2 

es un elemento de W, + W 2 ya que ax x Ç W, y ax> Ç W 2 . Luego enton- 
ces W, + W 2 es, por el Teorema 1.3, un subespacio de V. ■ 

Coro/or/o. La suma de cualquier número finito de subespacios de V es un 
subespacio de V. 

Una clase especial de suma jugará un papel importante en los capítulos 
siguientes. Introduciremos un caso especial de este concepto en la siguiente 
definición. 
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Definición. Se dice que un espacio vectorial V es la suma directa de W a y W 2 , 
expresada como V = W x 0 W 2 , si W t y W 2 son subespacios de V /a/e5 
que W a H W 2 = {0} y W x + W 2 = V. 

Ejemplo 13. Sea W x = {(a, 0): a£F} y W 2 —{(0, fc): b£F}. 
Luego, F 2 ~ Wi 0 W 2 . 

Ejemplo 14. Una función g de valor real definida en R se llama función 
par si g(~x) — g(x) para toda jc£jR y se llama función impar si 
g(— x) = — g(x) para toda Sean Wi y W 2 , respectivamente, los 

conjuntos de todas las funciones pares e impares en J(R , R). 

Demostraremos que J(R , F) — Wi0W 2 . Puede verse fácilmente que 
W x y W 2 son subespacios de J(F, R). (Ver Ejercicio 19.) Supongase que 
g £ Wi H W 2 ; entonces g es al mismo tiempo una función par e impar. 
Así g(—x) = g(x) y g(~x) = —g(;c) para cada x£ R y, por lo tanto, 
g es la función cero. Por lo tanto, W x n W 2 = {0}. Sea f£J(R, R), y 
defínase g, h£ J(R, R) como g(x) = í[f(x) + f(—x)] y h(x) = 
— i[/(*) “ /(—*)]• Entonces g es una función par y h es una función 
impar tales que f — g h. De aquí que / £ W x + W 2 . Como / es un 
elemento arbitrario de 7(F, F), se tiene que J(R, R) = W a + W_>. Esto 
es, J(R, R) es la suma directa de W u y W 2 . 

Si Wi y W 2 son subespacios de un espacio vectorial V tales que 
Wi + W ;2 = V, entonces, cada elemento de V puede expresarse como la 
suma de tm elemento x x en W a y un elemento x 2 en W 2 . Es posible que 
puedan existir muchas representaciones semejantes, es decir, que x^ y x 2 
no sean únicas. Por ejemplo, si 


y 


Wi = {(a x , a 2 , a 3 ) £ F 3 : a 3 = 0} 


W 2 = {(ai, a 2 , a 3 ) Ç F 3 : = 0}, 


claramente W x I W 2 = F 3 . De hecho, para cada cÇ F, (b u b 2 , b 3 ) = 
= (b u b 2 + c, 0) -f (0, —c, b 3 ) es una representación de (b u b 2 , b 3 ) 
como la suma de un elemento (b u b 2 + c, 0) en Wj y un elemento 
(0, — c, b 3 ) en W 2 . Así, en este ejemplo la representación de los elemen- 
tos de F 3 como las sumas de un elemento en W a y un elemento en W 2 
no es única. Nuestro próximo resultado determina cuándo existe este tipo 
de unicidad. 

Teorema 7.6 Sean W x y W 2 subespacios de un espacio vectorial V. Entonces 
V es la suma directa de W t y W 2 si y sólo si cada elemento de V puede 
ser escrito de manera única como Xi + x 2 , donde x^ Ç Wi y x 2 Ç W 2 . 

demostración. Supóngase que V = W a 0 W 2 . Como V = W x + V' , 
cada elemento de V puede ser expresado como la suma de vectores en W a 
y W 2 . Supóngase que algún elemento z en V puede ser escrito como 
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z — Xi + x, y también como z = y^ + y 2 , donde x l9 y^ Ç W x y x>, y 2 ç W 2 . 
Entonces, x t -h x 2 — y x 4- y 2 y así Xi — y x — y 2 — x 2 . Ahora bien, x x — 
~~ y-i € Wi puesto que ^ y ^ son elementos de W 1? y análogamente 
y -2 ~ x 2 Ç W, 2 . Pero como = y 2 ~ x> se deduce que x x — = 

= y-> - *> € Wi n w 2 = {6>}. 

Por lo tanto, x± — y r = y 2 — x 2 ~ 0, y así x, = y^ y = y 2 , lo que 
demuestra la unicidad de la representación de z como la suma de un ele- 
mento de W^ y un elemento de W 2 . 

La demostración de la proposición recíproca se deja al lector como 
ejercicio. ■ 


EJERCICIOS 

1. Decir si las siguientes proposiciones son verdaderas o falsas. 

(a) Si V es un espacio vectorial y W es subconjunto de V que es también 
un espacio vectorial, entonces W es un subespacio de V. 

(b) E1 conjunto vacío es un subespacio de todo espacio vectorial. 

(c) Si V es un espacio vectorial distinto del espacio vectorial cero {0}, 
entonces V contiene un subespacio W tal que W ^ V. 

(d) La suma de dos subconjuntos cualesquiera de V es un subespacio 
de V. 

(e) Una matriz diagonal n x n no puede tener más de n términos no 
nulos. 

(f) La traza de una matriz cuadrada es el producto de sus términos que 
se encuentran sobre la diagonal. 

2 . Determinar la transpuesta de cada una de Ias siguientes matrices. Además, 

si la matriz es cuadrada, calcular su traza. 



(c) 



(e) (1, -1, 3, 5) 


(g) 



3. Demostrar que (aA + bB) £ — aA l + bB £ para toda A, B Ç M mx<n (F) y 
toda a, b Ç F. 
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4. Demostrar que (A 1 ) 1 = /1 para toda A £ M mxn (F). 

5. Demostrar que A + A l es simétrica para cualquier matriz cuadrada A. 

6. Demostrar que tr (aA + bB) = atr(/i) + òtr(fí) para toda A y 
Be M» xn (F). 

7. Demostrar que las matrices diagonales son matrices simétricas. 

8 . Verificar que los siguientes conjuntos son subespacios de R 3 bajo las opera- 
ciones de suma y multiplicación por escalares definidas en R 3 . 


(a) 

W, = {(«,, 

02 , o 3 ) e R 3 : 

— 3a 2 y a 3 = 

-o 2 } 

(b) 

W 2 = {(a u 

o 2 , a 3 ) C R 3 : 

2ai + a 2 + 5a 3 - 

= 0} 

(c) 

W 3 = {(<*, 

a>, a 3 ) € R 3 : 

a x 4a 2 a 3 — 

0} 


9. Sean W l9 W 2 , y W 3 como en el ejercicio 8. Describir W t fì W 2 , W 2 fì W 3 , 
y Wj íì W 3 y obsérvese que cada una es subespacio de R 3 . 

10. Verificar que W t = {(a u . . , a n ) £ F u : a^ + . . . + = 0} es un subes- 

pacio de F n pero que W 2 = {(a u . .. , o») £ F u : + . .. + a^ — 1} no 

lo es. 

11. ^Es el conjunto W = (/ £ P(F): / = 0 o / tiene gradó n } un subes- 

pacio de P(F) si n > 1? Justifique su respuesta. 

12. Una matriz A de m x n se llama triangular superior si todos los términos 
ubicados por debajo de la diagonal valen cero, esto es, A ì} — 0 siempre 
que i > /. Verificar que las matrices triangulares superiores forman un sub- 
espacio de M mxlI]1 (F). 

13. Verificar que para cualquier £ S, W = {/£ 7(5, F): f(s 0 ) — 0} es un 

subespacio de 7(5, F). 

14. ^Es el conjunto de todas las funciones diferenciales de valores reales defi- 
nidas en R un subespacio de C(F)? Justifique su respuesta. 

15. Sea C n (R) el conjunto de todas las funciones de valor real definidas en 
la recta de los reales que tiene una derivada «-ésima continua (y, por tanto, 
derivadas continuas de orden 1, 2, . . . , n). Verificar que C n (R) es un 
subespacio de 7 (R, R). 

16. Demostrar que un subconjunto W de un espacio vectorial V es un subes- 
pacio de V si y sólo si W^0 y axC W y x + y£W siempre que 
a £ F y x, y £ W. 

17. Demostrar que un subconjunto W de un espacio vectorial V es un subes- 
pacio de V si y sólo si 0 £Wya* + y£W siempre que a £ Fyjc,y£W. 
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18. Sean W a y W 2 subespacios de un espacio vectorial V. Demostrar que 
Wi'U W ]2 es un subespacio de V si y sólo si Wj CW 2 o W 2 C W a . 

19. Sean F ± y F 2 campos. Una función g £ 7(F 1? F 2 ) se llama función par si 
g(— x) = g(*) para toda x£ F t y se llama función impar si g(— jc) = 
= —g(x) para toda jcÇ Fj. Demostrar que el conjunto de todas las fun- 
ciones pares en F(F U F 2 ) y el conjunto de todas las funciones impares en 
$(F U F 2 ) son subespacios de J(Fi, F e ). 


20. Mostrar que F n es la suma directa de los subespacios 


y 


Wi = {(a u . . . , On) £ F n : a» = 0} 


W 2 = { (a l9 . . . , a n ) £ F n : a t = ... = On-i = 0). 


21. Sea Wi el conjunto de polinomios f en P(F) tales que f(x) = 0 o, en la 
representación 

f(x) = OnX n + a n ~ïX n ~ 1 + . . . + a 0 , 

los coeficientes ao, Q>, a A , . . . de todas las potencias pares de x son iguales 
a cero. Análogamente, sea W 2 el conjunto de todos los polinomios g en 
P(F) tales que g(x) = 0 o, en la representación 

g(x) = bmx™ + b^x^ 1 + ... +b 0 , 

los coeficientes b ly b 3y b 5 , . . . de todas las potencias impares de x son 
iguales a cero. Demostrar que P(F) = W a ® W 2 . 

22. Sea W x = {AÇ_ M mxn (F): A xi = 0 cuando i > /} y W 2 = {A £ M mxai (F): 

= 0 cuando i < /}. (W- x es el conjunto de las matrices triangulares supe- 
riores definidas en el ejercicio 12.) Demostrar que M mxn (F) = Wi®W,. 

23. Sea V el espacio vectorial formado por todas las matrices triangulares supe- 
riores de n x n (como se definieron en el ejercicio 12), y sea W^ el 
subespacio de V formado por todas las matrices diagonales. Demostrar que 
V = Wj 0 W 2 , donde W 2 = {+ Ç V: A i} = 0 cuando / < /}. 


24.* Demostrar que si W es un subespacio de V y jc lf . . . , jc„ son elementos 
de W, entonces a^x^ + . . . + a n x n es un elemento de W para cualesquie- 
ra escalares a ,,..., a n en F. 


25. Una matriz M se llama anîisimétrica si M l = —M. Evidentemente una 
matriz antisimétrica es cuadrada. Demostrar que el conjunto de todas las 
matrices antisimétricas de n x n es un subespacio Wj de M llxn (F). Sea 
W 2 el subespacio de M axu (F) consistente de las matrices simétricas de 
n x n. Demostrar que M nxïl (F) = W t ® W 2 . 

* En otras secciones del libro haremos referencia a los problemas marcados 
con asterisco (*). 
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26. Sea W t = {A £ M nxn (F): = 0 cuando i < /} y sea W 2 el conjunto 

de matrices simétricas de n x n. W t y W 2 son ambos subespacios de 
AAaxn(^)- I>emostrar que M* xn (F) — Wi 0 W 2 . Compárense los ejerci- 
cios 25 y 26. 

27. Demostrar el corolario del Teorema 1.5. 

28. Completar la demostración del Teorema 1.6. 

29. Sea W un subespacio de un espacio vectorial V sobre un campo F. Para 
toda vÇV el conjunto {v}+W = {v + w: >v£W}se llama co-conjun- 
to de W que contiene a v. Es frecuente expresar este co-conjunto como 
v + W en vez de {v} + W. Demostrar lo siguiente: 

(a) v + W es un subespacio de V si y sólo si v £ W. 

(b) v x + W = v 2 + W si y sólo si v t — v a £ W. 

La suma y el producto por elementos de F puede definirse en el conjunto 
S = (v + W: v £ V} de todos los co-conjuntos de W como sigue: 

(vi + W) + (v 2 + W) = (Vi + v-i) + W 


para toda Vi, v-_, £ V y 

a{v + W) = av + W 


para toda v £ V y a £ F. 

(c) Demostrar que las operaciones anteriores están bien definidas; es 
decir, mostrar que si Vi + W = v'i + W y v 2 + W = v' 2 + W, en- 
tonces 

(vi + w) + (v a + w) = (v; + w) + (v; + w) 


y 

a(Vi + W) = a(v; + W) 
para toda a£ F. 

(d) Demostrar que el conjunto S es un espacio vectorial bajo las opera- 
ciones definidas anteriormente. Este espacio vectorial se llama espacio 
cociente de V módulo W y se expresa mediante V/W. 


1.4 COMBINACIONES LINEALES Y SISTEMAS 
DE ECUACIONES LINEALES 

En la sección 1.1 se mostró que la ecuación del plano que pasa por tres 
puntos no colineales P, Q y R en el espacio es x = P + /,« + t,v, donde 
u y v son los vectores que parten del origen y terminan, respectivamente, 
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en Q y R, y t x y t 2 san númeras reales cualesquiera. Un caso especial 
impartante ocurre cuando P es el origen. En este caso la ecuación del 
plano se simplifica a x ~ t x u + t,v, y el conjunto de todos los puntos conte- 
nidos en este plano es un subespacio de R 3 . (Esto se demostrará como 
el Teorema 1.7 de esta sección.) Expresiones de la forma t Y u + t 2 v donde 
U y 4 son escalares y u y v vectores, juegan un papel primordial en la 
teoría de los espacios vectoriales. La generalización apropiada de tales 
expresiones se expresa en la siguiente definición. 

Definición. Sea V urt espacio vectorial y S un conjunto no vacío de V. Se dice 
que un vector x de V es una combinación lineal de elementos de S, si 
existe un número finito de elementos y u . . . , y n en S y escalares a l9 . .. , a n 
en F tales que x = + . . . + a^yn. En este caso , es común decir que 

x es una combinación lineal de y u . .. , y n . 

Obsérvese que en cualquier espacio vectorial V, Ojc = 0 para toda 
xÇ_ V. Luego, el vector cero es una combinación lineal de cualquier sub- 
conjunto no vacío de V. 

Ejemplo 15. La tabla 1.1 muestra el contenido vitamínico de 100 gra- 
mos de 12 alimentos con respecto a vitaminas A, B x (tiamina), (ribo- 
flavina), niacina y C (ácido ascórbico). 


TABLA 1.1 Contenido de vitaminas 

de 100 

gramos de 

algunos alimentos 


A 

(unida 

- Bi 

B, 

Niacina 

c 


des) 

(mg) 

(mg) 

(mg) 

(mg) 

Compota de manzana 

0 

0.01 

0.02 

0.2 

2 

Manzanas frescas (recién cortadas) 

90 

0.03 

0.02 

0.1 

4 

Dulce relleno de coco y cubierto de 






chocolate 

0 

0.02 

0.07 

0.2 

0 

Almejas (únicamente la carne) 

100 

0.10 

0.18 

1.3 

10 

Pasteí de molde de masa 

0 

0.05 

0.06 

0.3 

0 

Féculas cocidas (no enriquecidas) 

(0)* 

0.01 

0.01 

0.1 

(0) 

Jaleas y conservas 

10 

0.01 

0.03 

0.2 

2 

Tarta de natillas de coco (horneada 






con harina) 

0 

0.02 

0.02 

0.4 

0 

Arroz café crudo 

(0) 

0.34 

0.05 

4.7 

(0) 

Salsa de soya 

0 

0.02 

0.25 

0.4 

0 

Spaghetti horneado (no enriquecido) 

0 

0.01 

0.01 

0.3 

0 

Arroz silvestre crudo 

(0) 

0.45 

0.63 

6.2 

(0) 


* Los ceros entre paréntesis indican que la cantidad de vitamina presente es 
casi nula o demasiado pequena para medirse. 


fuente: Composición de alimentos (ManuaUde Agricultura Número 8) por Berni- 
ce K. Watt y Annabel L. Merrill. División de Invèstigad6n de ,)a Economía y Ali- 
mentación del Consumidor, Departamento- de Agricultura de los Estados Unidos, 
Í963. ^ Dlí-f ' 

Tci.ts. ' F - CAS 
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Registraremos el contenido vitaminico de 100 gramos de cada alimento 
como un vector columna en R’ —por ejemplo, el vector vitamínico para 
la compota de manzana es 


/ 0 . 00 \ 

0.01 

0.02 . 

0.20 

\ 2.00 

Considerando los vectores vitamínicos para el pastel de molde, la tarta 
de natillas de coco, el arroz café, la salsa de soya y el arroz silvestre, se 
ve que 


/0.00) 


/0.00\ 


/0.00\ 


/0.00\ 


/0.00 ^ 

í 0.05 


[ 0 . 02 ' 


0.34 


0.02' 


[ 0.45 

0.06 

+ 

0.02 

+ 

0.05 

+ 2 

0.25 

= 

0.63 

0.301 


OAOl 


i 4 - 70 ! 


0.401 


,6.20 

lo.oo/ 


\o.ool 


lo.oo/ 


io.oo/ 


\o.ool 


Luego, el vector vitamínico para el arroz silvestre crudo es una combi- 
nación lineal de los vectores de vitaminas para el pastel de molde, tarta 
de natillas de coco, arroz café crudo y salsa de soya. Así, 100 gramos de 
pastel de molde, 100 gramos de tarta de natillas de coco, 100 gramos 
de arroz café crudo y 200 gramos de salsa de soya proporcionan exacta- 
mente las mismas cantidades de las 5 vitaminas que 100 gramos de arroz 
silvestre crudo. De una manera análoga, como 


/0.00\ 


/90.00\ 


/0.00^ 


/0.00\ 

> / 10 - 00 ì 


/0.00\ 


/100.00\ 

ío.oi' 


0.03 


0.02 


[o.or 


0.01 


f 0.01 


[ 0.10 

0.02 

+ 

! 0.02, 

+ 

0.07 

+ 

0.01 

+ 

0.03 

+ 

0.01 

= 

0.18 

0.20 


1 010 


0.20 j 


o.ioj 


0.201 


0.301 


i 1-30 

\ 2 .OOl 


l 4.00/ 


io.oo/ 


lo.oo / 


2.00/ 


io.oo/ 


1 10.00/ 


200 gramos de compota de manzana, 100 gramos de manzanas frescas, 
100 gramos de dulce de chocolate, 100 gramos de féculas, 100 gramos 
de jalea y 100 gramos de spaghetti proporcionan exactamente las mismas 
cantidades de las 5 vitaminas que 100 gramos de almejas. 

A través de los capítulos 1 y 2 se encontrarán muchas situaciones 
diferentes en las cuales será necesario determinar si un vector puede ser 
expresado como una combinación lineal de otros vectores. E1 cómo es 
posible hacerlo se reduce a un problema de solución de un sistema de 
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ecuaciones lineales. Ilustraremos esta importante técnica determinando 
si el vector (8, 15, 15, 12) en R 4 puede escribirse como una combinación 
lineal de * - (1, 2, 1, 2), y, = (-2, -4, -2, -4), y 3 = (1, 4, 2, 0), 
y 4 = (2, 7, 5, 0), y y 5 — (3, 7, 2, 6). Por tanto, deberemos determinar 
si existen escalares Oj, a?, a 3 , a* y a 5 tales que 

(8,15, 15, 12) — a,y, + a>y 2 + a 3 y 3 + a,y A + a,y r , 

= a x ( 1, 2, 1, 2) + a>( — 2, -4, -2, -4) + a 3 ( 1, 4, 2, 0) 
+ M2, 7, 5, 0) +a,(3, 7, 2, 6) 

(^i 2 ^Z ;2 + ÍI 3 + 2 í 7 4 + 3 ^ 5 , 2a 4 4ai2 + 4a 3 

+ la* + la 3 , a x — 2a> + 2 a 3 + 5 a 4 + 2 a r> , 

2 a Y — 4a 2 + 6 a 5 ). 


Se puede ver ahora fácilmente que (8, 15, 15, 12) puede ser expresado 
como una combinación lineal de y u y 2 , y 3 , y 4 y y 5 , si y sólo si existen esca- 
lares (a u a 2 , a 3 , a 4 , a 5 ) que satisfacen el sistema de ecuaciones lineales 

' a x — 2 a 2 + a 3 + 2a A + 3 a 5 = 8 

2a x — 4a 2 + 4 a 3 + 7a 4 + la 5 = 15 

7?! — 2a 2 + 2û?3 + 5íz 4 + 2tf 5 = 15 

2úfj — 4a 2 + 6a 5 = 12 

que se obtuvo igualando las coordenadas correspondientes de la ecuación 
anterior. 

Para resolver el sistema de ecuaciones (1) se substituirá éste por otro 
que tenga las mismas soluciones pero que sea mucho más sencillo de 
resolver. E1 procedimiento que utilizaremos expresará algunas de las in- 
cógnitas en términos de otras eliminando algunas de ellas en todas las 
ecuaciones, menos en una. Para empezar, eliminemos a x de la segunda, 
tercera y cuarta ecuaciones del sistema (1). Esta eliminación puede reali- 
zarse sumando —2 veces la primera ecuación a la segunda, —1 vez la 
primera ecuación a la tercera y — 2 veces la primera ecuación a la cuarta; 
el resultado será el nuevo sistema 

a x — 2 a 2 + a 3 + 2 a A + 3 a 5 = 8 

2a, + 3 a 4 + a, = -1 
a 3 + 3a 4 — a s = 1 

— 2 a 3 — 4 a 4 = —4 

en el cual se han eliminado a x y a 2 en todas las ecuaciones, excepto en 
la primera. Continuando con el sistema de ecuaciones (2), agregaremos 
múltiplos de la segunda ecuación a las otras con objeto de eliminar a 3 
de las ecuaciones menos en la segunda. En este caso debemos sumar —ì 
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veces la segunda ecuación a la primera para eliminar a 3 de ésta. Nótese, 
sin embargo, que si se intercambian la segunda y la tercera ecuaciones, 
los cálculos necesarios se simplifican. Entonces, intercambiaremos la se- 
gunda y tercera ecuaciones del sistema (2) para obtener 

'a x — 2a 2 + a 3 + 2 a 4 + 3 a 5 
a 3 + 3 a 4 — a 5 
2a 3 + 3a 4 + a 5 
, —2 a 3 — 4 a 4 

Ahora, sumando —1 veces la segunda ecuación a la primera, —2 veces la 
segunda ecuación a la tercera y 2 veces la segunda ecuación a la cuarta, 
el sistema de ecuaciones (3) se transforma en 

a x — 2 a 2 — a 4 + 4 a 5 

a 3 + 3a 4 — a 5 
—3a 4 + 3 a 5 
2 a 4 — 2 a 5 

A continuación debemos sumar múltiplos de la tercera ecuación a las otras 
con objeto de eliminar a 4 en cada una de las ecuaciones del sistema (4), 
excepto en la tercera. De nuevo, los cálculos se simplifican si se realiza 
una operación preliminar—multiplicar la tercera ecuación por — i. 
Esto da 

a x — 2 a 2 — a 4 + 4 a 5 = 1 
a 3 + 3 a 4 - a 5 = 7 

a 4 — a s — 5 U 

2 a 4 — 2 a 5 = 10. 


1 



= 10 . 



Por último, en el sistema (5) anadamos 1 vez la tercera ecuación a la 
primera, —3 veces la tercera ecuación a la segunda y — 2 veces la tercera 
ecuación a la cuarta para obtener 

'a x — 2 a 2 +3 a 5 = 6 

a 3 + 2a 5 = -8 

_ ( 6 ) 
a 4 — a 5 — 5 

0 = 0 . 

EI sistema de ecuaciones (6) es un sistema de la forma deseada: es fá- 
cil de resolver para a u a 3 y a 4 (las incógnitas que aparecen como primera 
incógnita presente en alguna de las ecuaciones) en términos de otras incóg- 
nitas (a 2 y a 5 ). Escribiendo de nuevo el sistema (6), encontramos que 
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cix — 2 a 2 — 3 a 5 + 6 
a z = —2 a 5 — 8 

a* = a 5 + 5 

Entonces, para cualquier selección de los escalares a* y a 5j un vector de 
la forma 


(úfi, a 2 , a Zj a 4 , a 5 ) 

“ ( 2úp 2 — 3û 5 + 6, Oo, —2a 5 — 8, a 5 + 5, a 5 ) 

= a 2 ( 2, 1, 0, 0, 0) + « 5 (-3, 0, -2, 1, 1) + (6, 0, -8, 5, 0) 

será solución del sistema original de ecuaciones (1). En particular, el 
vector (6, 0. —8, 5, 0) obtenido al hacer a> 2 = 0 y a 5 = 0 es una solu- 
ción del sistema (1). Entonces, 

(8, 15, 15, 12) = 6 y x + 0y 2 — 8 y, 3 + 5y 4 + 0y 5 , 

de manera que (8, 15, 15, 12) es una combinación lineal de y u y Uj y z , 
y* y y 5 . 

E1 procedimiento que acabamos de ilustrar puede utilizarse para resol- 
ver cualquier sistema de ecuaciones lineales. Obsérvese que se utilizaron 
tres tijx>s de operaciones para resolver el sistema original. 

1. Intercambio del orden de cualquier par de ecuaciones en el sis- 
tema. 

2. Multiplicación de cualquier ecuación por una constante no nula. 

3. Suma de cualquier múltiplo constante de ima ecuación a otra. 

Estas operaciones se utilizaron hasta obtener un sistema de ecuaciones 
con las siguientes propiedades: 

1. E1 primer coeficiente no nulo de cualquier ecuación es uno. 

2. Si una incógnita es la primera con coeficiente no nulo en alguna 
ecuación, entonces dicha incógnita aparece con un coeficiente nulo 
en cada una de las otras ecuaciones. 

3. La primera incógnita con coeficiente no nulo en cualquier ecua- 
ción tiene subíndice mayor que el de la primera incógnita con 
coeficiente no nulo en cualquier ecuación precedente. 

Para ayudar a aclarar el significado de estas propiedades, nótese que nin- 
guno de los siguientes sistemas satisface estas condiciones. 
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\x x + 3x 2 + x A = 7 


(7) 


[ 2x 3 — 5x 4 = — 1 


x x 

2x 2 + 3x 3 + x 5 —— 

-5 


x 3 — 2x s = 

9 

(8) 

x A + 3x s = 

6 



*i ~ 2 x 3 + x 5 = 1 




x 4 — 6 x 5 — 0 


(9) 


x 2 + 5x 3 3x 3 — 2 




Específicamente, el sistema de ecuaciones (7) no satisface la condición 1 
porque el primer coeficiente no nulo de la segunda ecuación es 2; el 
sistema de ecuaciones (8) no satisface la condición 2 porque x 3 , la prime- 
ra incógnita con coeficiente no nulo de la segunda ecuación, aparece con 
coeficiente no nulo en la primera ecuación; y el sistema de ecuaciones 
(9) no satisface Ia condición 3 porque x 2 , la prímera incógnita con 
coeficiente no nulo de la tercera ecuación, no tiene un subíndice mayor 
que x 4 , la primera incógnita con coeficiente no nulo de la segunda 
ecuación. 

Una vez que se ha obtenido un sistema en el que se satisfacen las 
propiedades 1, 2 y 3, es fácil de resolver para algunas de las incógnitas 
en términos de las otras (como en el ejemplo anterior). Sin embargo, si 
en el curso de la ejecución de las operaciones 1, 2 y 3 se obtuviera un 
sistema que tuviera una ecuación de la forma 0 = c, donde c no es nula, 
entonces el sistema original no tiene soluciones. (Ver el ejemplo 16 a 
continuación.) 

Regresaremos al estudio de sistemas de ecuaciones lineales en el capí- 
tulo 3. A1 mismo tiemjx), expondremos las bases teóricas para este método 
de solución de sistemas de ecuaciones lineales y su simplificación p>osterior 
mediante el uso de las matrices. 

Ejemplo 16. Demostraremos que 

2x* - 2x 2 + 12* - 6 
es una combinación lineal de 

jc 3 - 2x 2 - 5x - 3 y 3x 3 - 5x 2 - 4x - 9 
en P 3 (R) pero que 

3* 3 - 2x 2 + lx + 8 


no lo es. En el primer caso deseamos encontrar escalares a y b tales que 

2x A — 2x~ + \2x — 6 ~ a(x A — 2x 2 — 5x ~ 3) + b(3x 3 — 5x 2 — 4x 9) 
— (a + 3 b)x :i + (-2a - 5b)x 1 + (~5a — 4b)x + (-3 a ~ 9b). 
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Esto nos lleva a establecer el siguiente sistema de ecuaciones lineales: 


' a + 36 = 2 

—2 a - 5b = -2 
-5a-4b= 12 
-3 a -9 b= -6. 

Sumando múltiplos adecuados de la primera ecuación a las otras para 
eliminar a, encontramos 

'a+ 3 b= 2 
b= 2 
116 = 22 
0 = 0 . 

Ahora, sumando múltiplos adecuados de la segunda ecuación a las demás 
se tendrá 

a = —4 
6= 2 
0=0 
0 = 0 . 

Por lo tanto, 

2x 3 — 2x 2 + Í2x — 6 = — 4(x 3 — 2x- — 5x — 3) 

+ 2(3^ — 5+ J — 4jc — 9). 

En el segundo caso deseamos mostrar que no existen escalares a y b 
para los cuales 

3x a — 2x- + 7x + 8 = a(x 3 — 2x- — 5x — 3) 

+ 6(3x 3 - 5x- - 4 jc - 9). 

Como en el caso anterior, obtenemos un sistema de ecuaciones lineales 


' a + 36 = 3 

—2 a - 56 = -2 
' —5 a - 46 = 7 

—3a — 96 = 8. 

Eliminando a, al igual que antes, se tiene 

a+ 36= 3 
6= 4 
116 = 22 
0=17. 


( 10 ) 
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Pero la presencia de la ecuación inconsistente 0 = 17 indica que el siste- 
ma de ecuaciones (10) no tiene soluciones y, por tanto, 3jc 3 — 2jc 2 + 7jc + 
+ 8 no es una combinación lineal de jc 3 — 2jc 2 — 5jc — 3 y 3jc 3 — 5jc 2 — 
- 4jc - 9. 

E1 conjunto de combinaciones lineales de los elementos de un subcon- 
junto no vacío de un espacio vectorial proporciona otro ejemplo de subes- 
pacio, como lo muestra el siguiente resultado. 

Teorema J.7. Si S es un subconjunto no vacío de un espacio vectorial V, enton - 
ces el conjunto W, integrado por todas las combinaciones lineales de ele- 
mentos de S, es un subespacio de V más pequeho que contiene a S en el 
sentido de que W es un subconjunto de cualquier subespacio de V que 
contiene a S. 

demostración. Primero, emplearemos el Teorema 1.3 para probar que 

W es un subespacio de V. Como S^ 0, al menos 0 £ W. Si y y z son 

elementos de W, entonces y y z son combinaciones lineales de elementos 
de S, de manera que existen elementos jc 1? . .. , jc„ y w u . . . , w m en S 
tales que y ~ a x x x + . . . + a n x n y z — b x w x + . .. + b m w m para alguna 
selección de escalares a u . . . , a n y b u . . . , b m . Ahora bien, 

y + z = a x x x + . . . + OnX n + b x w x + . . . + b m w m 

y 


cy — ca x x x + . . . + COnXn 


son combinaciones lineales de elementos de S; luego entonces y + z y 
cy son elementos de W para cualquier c. Así, tenemos que W es un subes- 
pacio de V. 

Ahora bien, sea W' cualquier subespacio de V que contenga a S. Si y 
es un elemento de W, entonces y es una combinación lineal de elementos 
de S —digamos y — a x x Y + . . . + OnJC„, donde a u . . . , a n £F y jc 1? . .. , 
x n £ S. Puesto que S C W', x u . .. , x n £ W'. Luego entonces y — a x x x + 
+ . . . + OnX n es un elemento de W', de acuerdo con el ejercicio 24 de la 
sección 1.3. Como y , un elemento arbitrario de W, pertenece a W', 
W C W'. Esto completa la demostración. ■ 

Definición. Al subespacio W descrito en el Teorema 1.7 se le llama subespacio 
generado por los elementos de S y se denota por L(S). Por conveniencia, 
definiremos L( 0) ■= {C}. 

Obsérvese que el Teorema 1.7 muestra que * es una combinación li- 
neal de elementos de S si y sólo si x es un elemento de L(S). Luego, por 
ejemplo, en R 3 , L({(1, 0, 0), (0, 1, 0)}) es el plano 
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Definición . Un conjunto S de un espacio vectorial V genera a V si L(S) — V. 
En esta situación también podemos decir que los elementos de S gene- 
ran a V. 

Ejemplo 17. Los vectores (1, 1, 0), (1, 0, 1), y (0, 1, 1) generan a 
R 3 pues un elemento arbitrario (a u a 2 , a z ) de R 3 es una combinación lineal 
de los tres vectores dados; de hecho, los escalares r, s y t para los que 

r(l, 1, 0) + 5(1, 0, 1) + /(0, 1, 1) = (a u 02 , a 3 ) 


son 

r = ±(a x + a 2 - a 3 ), s = i(a x - a 2 + a 3 ), y t — i(~a x + a 2 + a 3 ). 


Ejemplo 18. Los polinomios jc 2 + 3jc — 2, 2x 2 + 5jc — 3 y —x 2 — 4jc + 
+ 4 generan a P 2 (R) pues cualquiera de los tres polinomios dados perte- 
nece a P 2 (/?) y cada polinomio ax 2 + bx + c en P 2 (/?) es una combina- 
ción lineal de los tres; a saber, 

(“8a + Sb + 3c)(x 2 + 3x - 2) + (4 a -2b - c)(2x 2 + 5jc - 3) 

+ (—a + b + c)( — x 2 — 4x + 4) = ax 2 + bx + c. 


Ejemplo 19. Las matrices 


(! í)-(i !)•(! ï). v (? !) 


generan a M 2x2 (R) pues un elemento cualquiera 

*• 

( a “ de M tx î(H) 
y a 2 \ a 2 2 J 

puede ser expresado como una combinación lineal de las cuatro matrices 
dadas de la siguiente manera: 


( ia ii + ia X2 ~r ia? i ia 22 ) 

+ ( ia lx + i a 12 — ioví + ia 22 ) 

+ ( ia xx iai 2 + ia 2X + ia 22 ) 

+ (~ia xx + ia X2 + ia 2X + ia 22 ) 


(! 

(i 

G 

/0 


/«11 
\ 02 1 


a 12 \ 

a 2 2 J 


i) 

!) 

ï) 

!) 
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EJERCICIOS 

1. I>ecir si las siguientes expresiones son verdaderas o falsas. 

(a) E1 vector cero es una combinación lineal de cualquier conjunto no 
vacío de vectores. 

(b) E1 subespacio generado por 0 es 0. 

(c) Si S es un subconjunto de un espacio vectorial V, L(S) es igual a 
la intersección de todos los subespacios de V que contienen a S. 

(d) A1 resolver un sistema de ecuaciones lineales se puede multiplicar 
una ecuación por una constante. 

(e) A1 resolver un sistema de ecuaciones lineales se permite sumar un 
múltiplo de una ecuación a otra. 

(f) Todo sistema de ecuaciones lineales tiene una solución. 

2. Resolver los siguientes sistemas de ecuaciones lineales por el método expues- 

to en esta sección. 


(a) 

'2x x 

— 2x 2 — 3x 3 

= -2 




3*! 

— 3x 2 — 2x 3 -j- 

5x 4 = 7 




X x 

— x 2 — 2x 3 — 

x 4 = —3 



(b) 


— 7x 2 + 4x 3 = 

10 



< 


— 2x 2 + x 3 = 

3 




2x t 

— x 2 — 2x 3 = 

6 



(c) 


+ 2x 2 — x 3 + 

x 4 = 5 



< 

*i 

+ 4x 2 — 3x 3 — 

3x 4 = 6 




2x x 

+ 3x 2 — x 3 + 

00 

II 

3 



(d) 

ÍXt + 2x 2 + 2x } 

= 2 




'x 

+ 8at 3 + 5x4 = —6 




[x j -f- x 2 H - 5x 3 -f- 5 x 4 — 3 



(e) 

X 

i + 2x 2 — 4 x 3 

— x 4 + 

x 5 = 

7 


— X 

i + 10x 3 

— 3x 4 — 

4x 5 = 

-16 


2x 

! + 5x 2 — 5x 3 

— 4x 4 — 

x 5 = 

2 


k 4x 

i + 1 lx 2 7 x 3 

- 10*4 - 

2x 5 = 

7 

(0 

Xi 

+ 2x 2 + 6x 3 = 

-1 




2x, 

+ x 2 + x 3 = 

8 




3xj 

+ x 2 — x 3 = 

15 




Xj 

+ 3x 2 + 10x 3 = 

-5 
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3. Para cada uno de los siguientes grupos de vectores en R 3 , determine si el 
primer vector puede o no ser expresado como una combinación lineal de 
los otros dos. 

(a) (-2,0,3), (1,3,0), (2,4, -1) 

(b) (1,2, -3), (-3,2, 1), (2, -1, -1) 

(c) (3,4, 1), (1, -2, 1), (-2, -1, 1) 

(d) (2, -1,0), (1,2, -3), (1, -3,2) 

(e) (5, 1, —5), (1, -2, -3), (-2,3, -4) 

(f) (-2,2,2), (1,2, -1), (-3, -3,3) 

4. Para cada uno de los siguientes grupos de polinomios en P 3 (R), determine 
si el primer polinomio puede o no ser expresado como una combinación 
lineal de los otros dos. 

(a) jt 3 — 3jc + 5, Jt 3 + 2jc 2 — jc + 1, jc 3 + 3jc 2 — 1 

(b) 4jc 3 + 2jc 2 - 6, jc 3 - 2jc 2 + 4jc + 1, 3jc 3 - 6jc 2 + jc + 4 

(c) — 2jc 3 — IIjc 2 + 3jc + 2, jc 3 - 2jc 2 + 3jc - 1, 2jc 3 + jc 2 + 3x - 2 

(d) jc 3 + jc 2 + 2jc + 13, 2JC 3 — 3jc 2 + 4jc + 1, jc 3 — x 2 + 2jc + 3 

(e) jc 3 - 8jc 2 + 4jc, jc 3 - 2x 2 + 3jc - 1, jc 3 - 2jc + 3 

(f) 6jc 3 — 3jc 2 + jc + 2, jc 3 — jc 2 + 2jc + 3, 2jc 3 + jc 2 — 3jc + 1 

5. En F n sea el vector cuya coordenada /-ésima es 1 y cuyas otras coorde- 

nadas son 0. Demostrar que [e u e 2 , . . . , e n ) genera a F n . 

6. Mostrar que Pn(F) puede generarse por (1, jc, jc 2 , . . . , jc h }. 

7. Mostrar que las matrices 

Co o> (S ì). c °o). > (S ï) 

generan a AAoxsí/ 7 )- 

8. Demostrar que si 



entonces el subespacio generado por [M u M u M 3 } es el conjunto de todas 
las matrices simétricas de 2 x 2. 

9.* Para cualquier elemento jc en un espacio vectorial, demostrar que L((jc}) = 
= { ax : a£ F). Interpretar este resultado geométricamente en R 3 . 


10. Demostrar que un subconjunto W de un espacio vectorial V es un subes- 
pacio de V si y sólo si L(W) — W. 
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11. * Demostrar que si y S 2 son subconjuntos de un espacio vectorial V tales 

que Sr Ç S>, L(S t ) Ç L(S 2 ). En particular, si S\ Ç S> y L(S^) = V, se 
deduce que L(S>) = V. 

12. * Demostrar que si Si y S 2 son subconjuntos cualesquiera de un espacio vecto- 

rial V, entonces L(S^ U S 2 ) = L(5\) + L(S 2 ). 

13. Sean y S 2 subconjuntos de un espacio vectorial V. Demostrar que 
L(Sr n S 2 ) Ç L(S^) H L(S 2 ). Dar un ejemplo en el cual L(5i n S 2 ) y 
L(S } ) n L(S 2 ) sean iguales y un ejemplo donde sean distintas. 


1.5 DEPENDENCIA E INDEPENDENCIA LINEAL 

A1 principio de la sección 1.4, observamos que la ecuación de un plano 
que pasa por tres puntos no colineales en el espacio, uno de los cuales 
es el origen, es de la forma x = t r u + / 2 v, donde u, v £ R 3 y h y t 2 son 
escalares. Así, un vector x en R 3 es una combinación lineal de u, v Ç R 3 
si y sólo si x se ubica en el plano que contiene a u y v. (Ver figura 1.5.) 
Vemos, por tanto, que en R 3 la amplitud de dos vectores no paralelos 
tiene una interpretación geométrica sencilla. Se le puede dar una interpre- 
tación similar a la amplitud de un vector individual no nulo en R 3 . (Ver 
el ejercicio 9 de la sección 1.4.) 



figura 1.5 

En la ecuación jc = t x u + t 2 v, x depende de u y v en el sentido de 
que x es una combinación lineal de u y v. Un conjunto en el que al 
menos un vector es una combinación lineal de los otros se llama un con- 
junto linealmente dependiente. Considérese, por ejemplo, el conjunto 
S= [x u x 2 , x 3 , x 4 ) Ç R 3 , donde x t = (2, -1, 4), x> = (1, -1, 3), 
x 3 = (1, 1 , —1), y x 4 = (1, —2, —1). Para determinar si S es lineal- 
mente dependiente debemos ver si existe o no un vector en S que sea 
una combinación lineal de los demás. Ahora bien, el vector x x es una 
combinación lineal de x u x 2 y x 3 si y sólo si existen escalares a, b y c 
tales que 


* 4 — ux i + bx 2 + cx 3 
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es decir, si y sólo si 

x 4 = (2a + b + c, —a — b -r c, 4a 4- 3b — c). 

Por tanto x 4 es una combinación lineal de x u x 2 y x 3 si y sólo si el sistema 

'2 a + b + c ~ 1 

< —a — b + c = — 2 

4a + 3b — c = — 1 

tiene solución. E1 lector deberá verificar que en este caso no existe tal 
solución. Nótese, sin embargo, que esto no significa que el conjunto S 
no sea linealmente dependiente, pues es necesario verificar si jci, x 2 y x 3 
pueden o no ser escritos como una combinación de los otros vectores 
de S. Puede demostrarse, de hecho, que x 3 es una combinación lineal de 
*i, *2 y a: 4 ; específicamente, x. 3 = 2x x - 3x 2 + 0x 4 . Así, S es en efecto 
linealmente dependiente. 

Se ve de este ejemplo que la condición para dependencia lineal que 
se ha dado no es adecuada, porque no todo vector en S necesita ser una 
combinación lineal de los demás, aun cuando S sea linealmente depen- 
diente. Reformulando Ia definición de Ia siguiente manera obtenemos una 
definición de dependencia más fácil de usar. 

Definición . Un subconjunto S de un espacio vectorial V es linealmente depen - 
diente si existe un número finito de vectores distintos x u x 2 , . .. , x n en S 
y escalares a 4 , a 2 , . . . , a n en F, no todos cero , tales que a^ + a 2 x 2 + 
+ . . . + a n x n — 0. También se puede describir esta situación diciendo 
que los elementos de S son linealmente dependientes. 

Para demostrar que el subconjunto S de R 3 que hemos definido es 
linealmente dependiente usando esta definición, debemos encontrar esca- 
lares a u a 2 , a 3 y a 4 , no todos nulos, tales que 


a x x i + q 2 x 2 + a 3 x 3 + a 4 x 4 = 0, 


es decir, tales que 


(2a 4 + a> + a 3 + a 4 , ~a 4 ~ a 2 + a 3 — 2a 4 , 4a 4 + 3 a 2 — a 3 — a 4 ) = 

= ( 0 , 0 , 0 ). 


Por ello debemos encontrar una solución para el sistema 

2a x + a 2 + a 3 + a A = 0 
< —a x ~ a 2 + a 3 — 2a 4 = 0 
k 4a x + 3a 2 — a 3 — a 4 = 0 
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donde no todas las Lncógnitas valen cero. Como para el caso propuesto 
antes sabemos que x 3 — 2x x — 3x> + 0jc 4 , se tiene que 0 — 2x x — 3x_, — 
— * 3 + 0x 4 . De aquí, tenemos que a x — 2, a 2 — —3, a 3 — —1 y a 4 = 0 
es dicha solución. 

Por lo tanto se ve que la definición establecida de dependencia lineal 
requiere de la solución de únicamente un sistema de ecuaciones en vez 
de dos o más. E1 lector deberá verificar que las dos condiciones para 
dej>endencia lineal que hemos tratado son, de hecho, equivalentes. (Ver 
ejercicio 10.) 

Puede verse fácilmente que, en cualquier espacio vectorial, un subcon- 
junto S que contenga al vector cero debe ser linealmente dependiente. 
Como 10 — 0, el vector cero es una combinación lineal de elementos 
de S en la que algún coeficiente es no nulo. 

Ejemplo 20. En R 4 el conjunto S = {(1, 3, — 4, 2), (2, 2, —4, 0), 
(1, —3, 2, —4)} es linealmente dependiente puesto que 

4(1, 3, -4, 2) - 3(2, 2, -4, 0) + 2(1, -3, 2, -4) - (0, 0, 0, 0). 

De manera semejante, en M- 4x3 (/?) el conjunto 

f/ 1 -3 2 \ (- 3 7 4\ (-2 3 11 \1 

\\-4 0 5J'\ 6 -2 — 7 y’ \~1 -3 2)\ 

es linealmente dependiente puesto que 

*(-î -l -í)-*(:ï -3 ")- 

= /0 0 0 \ 

[o o o y 

Definición. Se dice que un subconjunto S de un espacio vectorial, que no es 
linealmente dependiente, es linealmente independiente. Como anteriormen- 
te, describiremos a menudo esta situación diciendo que los elementos de 
S son linealmente independientes. 

Nótese que el conjunto vacío es linealmente independiente, puesto que 
obviamente los conjuntos linealmente dependientes deben ser no vacíos. 
Más aún, en cualquier espacio vectorial, un conjunto integrado de un 
solo vector no nulo es linealmente independiente. Si {x} es linealmente 
dependiente, entonces ax — 0 para algún escalar a no nulo. Pero en- 
tonces 

x — a 1 (ax) — a A 0 — 0. 

Además, un conjunto S es linealmente independiente si y sólo si las 
únicas combinaciones lineales de elementos de S iguales a 0 son las com- 
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binaciones lineales triviales en donde todos los escalares valen cero. Este 
hecho proporciona un método muy útil para determinar si un conjunto 
finito es linealmente independiente. Esta técnica se ilustra en el siguiente 
ejemplo. 

Ejemplo 21. Sea x k el vector en F n cuyas primeras k — 1 coordenadas 
son ceros y cuyas últimas n — h + 1 coordenadas son 1. Entonces 
{x u x 2 , . .. , x n ) es linealmente independiente, porque si a^ + a 2 x* 2 + 
+ . .. + OnX n = 0, igualando las coordenadas correspondientes de la iz- 
quierda y derecha de esta igualdad se tiene el siguiente sistema de ecua- 
ciones: 

(a x = 0 

0i + n 2 =0 

^ a x + a 2 + 03 =0 

< 0 i + 02 + 03 4- • • • + a„ = 0 . 

Claramente se ve que la única solución de este sistema es a x = a 2 = ... = 
= 0 » = 0 . 

Los siguientes resultados útiles son consecuencias inmediatas de las 
definiciones de dependencia e independencia lineal. 

Teorema 1.8. Sea V un espacio vectorial y sea Si Ç S 2 Q V. Si Si es lineal - 
mente dependiente entonces S 2 también lo es. 

DEMOSTRACiÓN. Ejercicio. 

Corolario. Sea V un espacio vectorial y sea Q S 2 Q V. Si S 2 es linealmente 
independiente entonces Si también lo es. 

demostración. Ejercicio. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Si S es un conjunto linealmente dependiente, cada elemento de S 
es una combinación lineal de otros elementos de S. 

(b) Cualquier conjunto que contenga al vector cero es linealmente de- 
pendiente. 

(c) E1 conjunto vacío es linealmente dependiente. 
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(d) Subconjuntos de conjuntos linealmente dependientes son linealmente 
dependientes. 

(e) Subconjuntos de conjuntos linealmente independientes son lineal- 
mente independientes. 

(f) Si x u x„ . . . , x» son linealmente independientes y + a 2 x 2 + 
+ . .. + OnX n — 0 , todos los escalares a t son iguales a cero. 

2. En F n sea e ŷ el vector cuya coordenada /-ésima es 1 y las demás son 0. 
Demostrar que {e u e 2 , . . . , e n ) es linealmente independiente. 

3. Demostrar que el conjunto {1, x, x 2 , . . . , x n } es linealmente independiente 
en P n (F). 

4. Demostrar que las matrices 

(ó 2). (°o î). (? ° 0 > T (°o î) 

son linealmente independientes en M 2x a(F). 

5. Encontrar el conjunto de matrices diagonales Iinealmente independientes 
que generan al espacio vectorial de matrices diagonales de 2x2. 

6. * Demostrar que {j:, >>} es linealmente dependiente si y sólo si x o y es un 

múltiplo del otro. 

7. Dar un ejemplo de tres vectores linealmente dependientes en R 2 tales que 
ninguno de los tres es múltiplo de otro. 

8. Demostrar el Teorema 1.8 y su corolario. 

9. (a) Demostrar que {«, v) es linealmente independiente si y sólo si 

{u + v, ii — v} es linealmente independiente. 

(b) Demostrar que {«, v, w} es linealmente independiente si y sólo si 
{u + v, u + vv, v -r vv} es Iinealmente independiente. 

10. Demostrar que un conjunto S es linealmente dependiente si y sólo si S — {0} 
o si existen vectores distintos y, x ly x->, ... , x n en S tal que y es una 
combinación lineal de x u x 2 , . . . , x„. 

11. Sea S {xi, x>, . . . , x n } un conjunto finito de vectores. Demostrar que 
S es linealmente dependiente si y sólo si Xj — 0, o x* +1 £ L{{x u x.., ... , 
x fc }) para alguna k < n. 


12. Demostrar que un conjunto S de vectores es linealmente independiente si 
y sólo si cada subconjunto finito de S es linealmente independiente. 
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13. Sea M una matriz cuadrada triangular superior (como se definió en el 
ejercicio 12 de la sección 1.3) que tenga términos no nulos en la diagonal. 
Demostrar que las columnas de M son linealmente independientes. 

14. Sean f y g funciones definidas por f(î) = e rt y g(t) = e 8t , donde r^s. 
Demostrar que f y g son linealmente independientes en 7(R, R). Sugeren- 
cia: Suponer que ae rt + be st = 0. Hacer / = 0 y obtener una ecuación 
que involucre a y b. Luego diferenciar ae rt 4- be 8t = 0, y hacer / = 0 
para tener una segunda ecuación en a y b. Resolver ambas ecuaciones para 
a y b. 

1.6 BASES Y DIMENSION 

Un subconjunto S de un espacio vectorial V que sea linealmente indepen- 
diente y que genere a V posee una propiedad muy útil —cada elemento 
de V puede ser expresado de una y sólo una manera como combinación 
lineal de elementos de S. (Esta propiedad será demostrada en el Teore- 
ma 1.9.) Es este resultado el que hace que los conjuntos generadores 
linealmente independientes sean los elementos constructivos de los espa- 
cios vectoriales. 

Definición. Una base f3 para un espacio vectorial V es un subconjunto lineal- 
mente independiente de V que genera a V. (Si (3 es una base de V, dire- 

mos a menudo que los elementos de (3 forman una base de V.) 

Ejemplo 22. Recordando que L(0) = {0}, se dice que 0 es una base 
para el espacio vectorial {0}. 

Ejemplo 23. En F n , sea e x = (1, 0, 0, . . . , 0, 0), e> = (0, 1, 0, . . . , 

0, 0), . .. , e n = (0, 0, 0, . . . , 0, 1); se ve claramente que [e u e 2 , . . . , 

e n } es una base para F n y se llama base estândar para F n . 

Ejemplo 24. En M mxll (F), sea M ij la matriz cuyo único elemento no 
nulo es un 1 en el i-é simo renglón y y-ésima columna. Luego { M ij : 
1 < i < 1 < / < w} es una base para M mxn (F). 

Ejemplo 25. En P n (F) el conjunto (1, x, x~, . . . , x n ) es una base. 

Ejemplo 26. En P(F) el conjunto {1, x, x 2 , . . .} es una base. 

Observar que el ejemplo 26 muestra que una base no necesariamente 
debe ser finita. De hecho, veremos más adelante en esta sección que nin- 
guna base para P (F) puede ser finita. Entonces, no todo espacio vectorial 
tiene una base finita. 
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E1 siguiente teorema, que se utilizará frecuentemente en el capítulo 2, 
muestra la propiedad más importante de una base. 

Teorema ?.9. Sea V un espacio vectorial y (3 = {x 1? . . . , x n } un subconjunto 
de V. Luego (3 es una base de V si y sólo si cada vector y en V puede 
ser expresado de manera única como una combinación lineal de vectores 
de f3, es decir, puede ser expresado en la forma 

y - a x x t + . . . + a n x n 
para escalares únicos a l5 ... , a„. 

demostración. Sea fi una base para V. Si y Ç V, entonces y £ L(ft) 
puesto que L(fi) = V. Luego, y es una combinación lineal de los elemen- 
tos de J3. Supóngase que y = a±x i + . . . + OnX n y y = b x : c x + . . . + b n x n 
son dos posibles representaciones de y. Restando la segunda igualdad de 
la primera se tendrá 

0 = («i - &i)*i +... + («„ — ò n ) jr n . 

Como es linealmente independiente, se tiene que a x — b x = ... = a^ — 
— = 0. Luego, ûi = b u . . . , On — b n , de tal modo que y sólo puede 

expresarse como una única combinación lineal de los elementos de J3. 

La prueba de la proposición recíproca se deja al lector como ejer- 
cicio. ■ 

E1 Teorema 1.9 muestra que cada vector v en un espacio vectorial V 
con una base (3 = [x u . . . , x n ) puede ser expresado de manera única en 
la forma v = a^Xi + . . . + a n x n para escalares a u . .. , seleccionados 
adecuadamente. Luego, v determina una única tt-dimensional de escalares 
(a u . .. , On) y, recíprocamente, cada n-dimensional de escalares deter- 
mina un vector único v, al utilizar los términos de la Ai-dimensional como 
los coeficientes de una combinación lineal de los vectores de J3. Este he- 
cho sugiere que V es similar al espacio vectorial F n , donde n es el 
número de vectores de una base para V. En la sección 2.4 veremos que 
éste es realmente el caso. 

Nuestro próximo teorema identificará una gran clase de espacios vec- 
toriales, cada uno de ellos con una base finita. Sin embargo, es necesario 
que primero probemos un resultado preliminar. 

Lema. Sea S un subconjunto linealmente independiente de un espacio vectorial 
V, y sea x un elemento de V que no está en S. Luego, S U {x} es lineal - 
mente dependiente si y sólo si x Ç L(S). 

demostración. Si S U {*} es linealmente dependiente, deberán existir 
vectores x u . . . , x n en S U {x} y escalares no nulos a u . . . , tales que 
a ± Xi + . . . + a n x n — 0. Puesto que S es linealmente independiente, una 
de las x u digamos x u es igual a x. Por ello a x x + a >x 2 + . . . + a n x n = 0, 
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y así * = ar^(~a 2 x 2 - ... — a n x n ). Como jc es una combinación lineal 
de x-j, . . . , x n , que son elementos de S, x £ L(S). 

Recíprocamente, supóngase que x£L(S). Luego, existen vectores 
x l9 . . . , x n en S y escalares a u ... , tales que x = a^x x + . .. + a n x n . 
Así, 0 = axJCx + . . . + OnXn + (~l)x,y como x^Xi para i = 1, . .. , n, 
{jci, . . . , x n , x) es linealmente dependiente. Por tanto, S U {x} es lineal- 
mente dependiente por el Teorema 1.8. ■ 

Teorema 1.10. Si un espacio vectorial V es generado por un conjunto finito 
So, entonces un subconjunto de S 0 es una base para V. Y por tanto , V 
tiene una base finita. 

demostración. Si S 0 = 0 o 5 0 = {0}, entonces V = {0} y 0 es un 
subconjunto de S 0 que es una base para V. De lo contrario, S 0 contendrá 
un elemento x t no nulo. Nótese que {x t } es un conjunto linealmente 
independiente. Continúese, si es posible, escogiendo elementos x 2 , . .. , x r 
en S 0 tales que {x u x 2 , ... , x r ) sea linealmente independiente. Como S 0 
es un conjunto finito, se debe alcanzar una etapa en la que S = {x u . . . , x r } 
sea un subconjunto linealmente independiente de S 0 pero que al aiiadir 
a S cualquier elemento de S 0 que no esté en S se produzca un conjunto 
linealmente dependiente. Demostraremos entonces que S es una base para 
V. Como S es linealmente independiente, basta con demostrar que 
L(S) = V, pero como L(S 0 ) = V, de acuerdo con el Teorema 1.7 es 
suficiente demostrar que S 0 C L(S). Sea x£ S 0 . Si x£ S, entonces evi- 
dentemente jcÇ L(S). De otra forma, si x 0 S, la anterior construcción 
mostraría que S U {x} es linealmenfe dependiente. Así, x£ L(S) de acuer- 
do con el lema y, por tanto, S 0 Q L(S). ■ 

E1 método por el cual se obtuvo la base S en la demostración anterior 
es una manera útil de obtener bases. Un ejemplo de este procedimiento es 
el que se da a continuación. 

Ejemplo 27. Los elementos (2, —3, 5), (8, —12, 20), (1, 0, 2), 

(0, 2, —1) y (7, 2, 0) generan a R 3 . De entre ellos seleccionaremos una 
base para R 3 . Para empezar, selecciónese cualquier elemento no nulo del 
conjunto generatriz, digamos (2, —3, 5), como imo de los elementos de 
la base. Como 4(2, -3, 5) = (8, -12, 20), el conjunto {(2, -3, 5), 
(8, -12, 20)} es linealmente dependiente (ejercicio 6, sección 1.5). Por 
tanto, (8, —12, 20) no será incluido en nuestra base. Como (1, 0, —2) 
no es múltiplo de (2, —3, 5), y viceversa, el conjunto {(2, 3, 5)(1, 0, 

— 2)} es linealmente independiente. Por tanto, (1, 0, —2) puede ser 
incluido en la base. Procediendo con el siguiente elemento del conjunto 
generatriz, se deberá excluir o incluir en nuestra base al elemento (0, 2, 

— 1) dependiendo de que el conjuntcj {(2, —3, 5), (1, 0, —2), (0, 2, 

— 1)} sea linealmente dependiente o linealmente independiente. Un cálcu- 
lo sencillo demuestra que el conjunto es linealmente independiente, luego, 
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(0, 2, ~1) también será incluido en nuestra base. E1 elemento final del 
conjunto generatriz (7, 2, 0) será excluido o incluido en nuestra base 
dependiendo de que {(2, -3, 5), (1, 0, -2), (0, 2, -1), (7, 2, 0)} 
sea linealmente dependiente o linealmente independiente. Ya que 

2(2, “3, 5) + 3(1, 0, 0, -2) + 4(0, 2, -1) - (7, 2, 0) = (0, 0, 0), 

el conjunto es linealmente dependiente y se excluye a (7, 2, 0) de la base. 
De esta manera, el conjunto {(2, —3, 5), (1, 0, —2), (0, 2, —1)} es 
una base para R 3 . 

E1 siguiente teorema y sus corolarios son quizá los resultados más 
significativos del capítulo 1 . 

Teorema 1.11 . Sea V un espacio veciorial que tiene una base (3 con exacta - 
mente n elementos. Sea S = {y l5 . . . , y in } un subconjunto linealmente 
independiente de V que contenga exactamente m elementos , donde m < n. 
Entonces, existe un subconjunto S x de /3 que contiene exactamente n — m 
èlementos tales que S U Si genera a V. 

DEMOSTRACiÓN. La demostración se hará por inducción sobre m. Prin- 
cipiaremos la inducción con m — 0, pues en este caso S = 0 , y así S x = {3 
satisface claramente la conclusión del teorema. 

Ahora, supóngase que el teorema es cierto para alguna m tal que 
m < n. Demostraremos que el teorema es cierto para m + 1. Sea S = {y l9 
. . . , y m , y m+ i} un subconjunto de V linealmente independiente, el cual 
contiene exactamente m + 1 elementos. Como [y l9 . . . , y w }/es linealmen- 
te independiente, de acuerdo con el corolario al Teorema 1 . 8 , aplicamos 
la hipótesis de inducción para concluir que existe un subconjunto [x u . .. , 
Xn^m} de J3 tal que {y l5 . . . , y m }JJ {x u . . . , x n ^n) genera a V. Por lo 
tanto, existirán escalares a l9 . . . , Om, b u b 2 , . . . , b n ^m tales que 

y m+ i = a,y x + . . . + Omym + b x x x + b 2 x 2 +...+/? n-mXn-m • ( 11 ) 

Obsérvese que algún b i9 tal como b u es no nulo, pues de lo contrario la 
ecuación ( 11 ) implicaría que y m+ i es una combinación lineal de y l9 . . . , 
y m en contradicción con la suposición de que {y u . . . , y m , y m+i } es lineal- 
mente independiente. Resolviendo la ecuación (11) para Jti se tendrá 

*i = (-^ 3 «i)yi + . . . + { — b-^Om)ym ~ {-b- x )y m +1 + {-b?b 2 )x 2 

+ ... + {—b-^b n -m)X n -m- ( 12 ) 

Entonces x r ^L{{y u ... , y m , y m+1 , x 29 ... 9 x n - m } de acuerdo con la ecua- 

ción ( 12 ), pero como y u ... , y m , x 2 , . . . , x n - m son claramente elementos 

de L{{y u . . . , y m , y m+ i, x 29 . . . , x n ^i}), se tendrá que 

{^iî • • • 5 y m > x 2 , . .. , * n - m } L L{{y u . . . , y m , y m+ i, x 2 , . . . , x n ^m}). 
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Por tanto, el Teorema 1.7 implica que 

L({yi, •. • , y m , y m+ i, x 2 , ... 9 * n -m}) = v. 

Luego, el escoger S x = { x 2 , . .. , x n ^m} demuestra que el teorema es cierto 
para m + 1. 

Esto completa la demostración. 

Para ilustrar el Teorema 1.11, nótese que S = {x 2 - 4, x - 6} es un 
subconjunto linealmente independiente de P*(F). Como = {1, x , x 2 } 
es una base de P 2 (F), deberá de existir un subconjunto S x de fi que con- 
tenga 3 - 2 = 1 elemento tal que S U S x genere a P 2 (F). En este ejemplo 
cualquier subconjunto de J3 que contenga un elemento será suficiente para 
5*1. Con esto se ve que el conjunto S x del Teorema 1.11 no necesariamente 
es único. 

Coro/or/o I. Sea V un espacio vectorial que tiene una base J3 que contenga exacta - 
mente n elementos. Entonces, cualquier subconjunto linealmente indepen- 
diente de V que contenga exactamente n elementos es una base de V. 

demostración. Sea S ~ {y u . . . , y n } un subconjunto de V lineal- 
mente independiente que contiene exactamente n elementos. Aplicando el 
Teorema 1.11 se ve que, existe un subconjunto S x de J3 que contiene 
n ~ n — 0 elementos tal que S U S x genera a V. Obviamente S x — 0 ; 
luego, S genera a V. Como S es también linealmente independiente, S es 
una base para V. | 

Ejemplo 28. Los vectores (1, -3, 2), (4, 1, 0) y (0+, -1) forman 
una base para R 3 , ya que si 

-3, 2) + 0,(4, 1, 0) + 0,(0, 2, -1) = (0, 0, 0), 
entonces a u a 2 y a 3 deberán satisfacer el sistema de ecuaciones 

a x + 4 a 2 = 0 

< —3ûf| + a 2 + 2a 3 = 0 
, 2a x - ci 3 = 0. 

Pero puede verse fácilmente que la única solución del sistema es a x = 0, 
^ = 0 y = 0. Entonces, (1, -3, 2), (4, 1, 0) y (0, 2, -1) son 
linealmente independientes y, de acuerdo con el corolario 1, forman una 
base para R 3 . 

Corolario 2. Sea V un espacio vectorial que tiene una base /3 con exactamente 
n elementos. Entonces, cualquier subconjunto de V que contenga más 
de n elementos es linealmente dependiente. Consecuentemente, cualquier 
subconjunto de V linealmente independiente contiene como máximo n 
elementos. 
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demostración. Sea S un subconjunto de V que contiene más de n ele- 
mentos. Con el fin de llegar a una contradicción supondremos que S es 
linealmente independiente. Sea *S\ un subconjunto cualquiera de S con 
exactamente n elementos. Entonces, de acuerdo con el corolario anterior, 
St es una base de V. Como S\ es un subconjunto propio de S , podemos 
tomar un elemento x de S que no sea elemento de £\. Como S\ es una 
base de V, x £ L(S\) = V. Luego, el lema previo al Teorema 1.10 impli- 
ca que S t U {x} es linealmente dependiente. Pero S\ U {x} C S ; luego, 
S es linealmente dependiente —una contradicción. Se concluye, por tanto, 
que S es linealmente dependiente. ■ 

Ejemplo 29. Sea S = {x 2 + 7, 8jc 2 - 2x, 4x - 3, Ix + 2}. Aun cuando 
se pueda demostrar directamente que S es un subconjunto linealmente 
dependiente de P>(F), esta conclusión se deriva inmediatamente del coro- 
lario anterior puesto que = {1, x , x 2 } es una base para P 2 (F) que 
contiene menos elementos que S. 

Corolario 3. Sea V un espacio vectorial que tiene una base p con exactamente 
n elementos. Entonces, toda base para V contendrá exactamente n ele- 
mentos. 

demostración. Sea S una base de V. Como S es linealmente indepen- 
diente tendrá como máximo, de acuerdo con el corolario 2, n elementos. 
Supóngase que S contiene exactamente m elementos; luego, m <n. Pero, 
además, S es una base de V y fi es un subconjunto linealmente indepen- 
diente de V. Entonces, el corolario 2 puede ser aplicado intercambiando 
los papeles de J3 y S para dar n < m. Luego m = n. ■ 

Si un espacio vectorial tiene una base con un número finito de elemen- 
tos, entonces el corolario anterior establece que el número de elementos 
en cada base para el espacio es el mismo. Este resultacjo hace posibles 
las siguientes definiciones. 

Definiciones. Un espacio vectorial V se llama dimensionalmente finito si tiene 
una base que consta de un número finito de elementos; el único número 
de elementos en cada base de V se llama dimensión de V y se denota por 
dim(V). Si un espacio vectorial no es dimensionalmente finito, se llama 
dimensionalmente infinito. 

Los siguientes resultados son consecuencia de los ejemplos 22 a 26. 
Ejemplo 30. El\espacio vectorial {0} tiene dimensión cero. 

Ejemplo 31. E1 espacio vectorial F n tiene dimensión n. 

Ejemplo 32. E1 espacio vectorial AA ni>I11 (F) tiene dimensión mn. 
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Ejemplo 33. E1 espacio vectorial P n (F) tiene una dimensión n + 1. 

Ejemplo 34. E1 espacio vectorial P(F) es dimensionalmente infinito. 

Los dos ejemplos siguientes demuestran que la dimensión de un espa- 
cio vectorial depende de su campo de escalares. 

i 

Ejemplo 35. E1 espacio vectorial de los números complejos tiene dimen- 
sión 1 sobre el campo de los números complejos. (Una base es {1}.) 

Ejemplo 36. E1 espacio vectorial de los números complejos tiene dimen- 
sión 2 sobre el campo de îos números reales. (Una base es (1, /}.) 

Corolario 4. Sea V un espacio vecîorial de dimensión n, y sea S un subcon- 
junto de V que genera aV y contiene como máximo n elementos . Entonces , 
S es una base para V y, por tanto , contiene exactamente n elementos. 

demostración. Existe un subconjunto de S tal que S^ es una base 
de V (Teorema 1.10). Por el corolario 3, S x contiene exactamente n ele- 
mentos. Pero S x Ç S y S contiene a lo más n elementos, luego S = S ± y 
S es una base de V. ■ 

Ejemplo 37. Se tiene del ejemplo 18 y del corolario 4 que (;t 2 + 3x - 2, 
2x- 4 - 5x — 3, — x 2 — 4x 4 - 4} es una base para P 2 (#). 

Ejemplo 38. Se tiene del ejemplo 19 y del corolario 4 que 

(1 «■ C i> C !) > C I) 

forma una base de AA,. x;2 (/?). 

Corofar/o 5. Sea p una base de un espacio vectorial V de dimensión n y sea 
S un subconjunto linealmente independiente de V que contiene m elemen- 
tos . Entonces, existe un subconjunto S x de /3 tal que S u S x es una base 
de V. 

demostración. Por el corolario 2 del Teorema 1.11 sabemos que 
m < n. Entonces, por el Teorema 1.11, existe un subconjunto 5i de fi 
que contiene exactamente n — m elementos tal que S U S x genera a V. 
Es obvio que S U S x contiene a lo más n elementos; así, el corolario 4 
implica que S U es una base de V. ■ 

Los Teoremas 1.10 y 1.11, sus cinco corolarios y el ejercicio 11 con- 
tienen toda una riqueza de información acerca de las relaciones entre 
conjuntos linealmente independientes, bases y conjuntos generatrices. Por 
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esta razón resumiremos los principales resultados de esta sección para 
situarlos en una mejor perspectiva. 

Una base de un espacio vectorial V es un subconjunto linealmente 
independiente de V que genera a V. Si V tiene una base finita, entonces 
cualquier base de V contiene el mismo número de vectores. Este número 
se llama dimensión de V, y se dice que V es dimensionalmente finito. 
Luego, si la dimensión de V es n, toda base para V contiene exactamente 
n vectores. Además, cada subconjunto de V linealmente independiente 
contiene no más de n vectores y puede ser tomado como base de V me- 
diante la inclusión de vectores adecuadamente escogidos. Por otra parte, 
cada conjunto generatriz de V contiene al menos n vectores y puede ser 
transformado en una base para V eliminando adecuadamente algunos de 
los vectores escogidos. La figura 6 describe estas relaciones. Veremos en 
la secctón 2.4 que todo espacio vectorial sobre F de dimensión n es esen- 
cialmente el espacio F n . 



E1 siguiente ejemplo ilustra cómo pueden utilizarse estos resultados 
para obtener una importante conclusión no trivial. 

Sean c 0 , c l9 . .. , c n elementos distintos de un campo infinito F. Los 
polinomios f 0 (x ), f ± (x), ... , / n (j c), donde 

(X - Cp). . .(X - Cj-^jx - Cui) • • • (X - C n ) 

(d ~ Co) . . . (Ci ~ d-i) (d ~ d+i) • • • (Ci - C n ) 


j~o C i Cj 
j*i 


íi(x) = 
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se llaman polinomios de Lagrange (asociados a c 0 , c l9 ... 9 c n ). Tomando 
a fi(x ) como una función polinomial /*: F F, se ve que 

:;;í' <> 3 > 

Se utilizará esta propiedad de los polinomios de Lagrange para demos- 
trar que J3 = {/ 0 , f u ... , f n } es un subconjunto linealmente independiente 
de P n (F). Como la dimensión de P n (F) es n + 1 se tendrá por el coro- 
lario 1 del Teorema 1.11 que J3 es una base de P n (F). Para demostrar 
que J3 es linealmente independiente, supóngase que: 

n 

2 tfi/i = 0 para algunos escalares a 0 , a u , a n , 

i= 0 

donde 0 es la función cero. Entonces 

n 

2 a,fi(Cj) = 0 para j = 0, 1, . .. , n. 

i= 0 

pero también 

n 

2 a,f,(Cj) = Oj 

i=0 

por la ecuación (13). De aquí que a ỳ = 0 para / = 0, 1, . .. , n y se 
tiene que es linealmente independiente. 

Como J3 es una base para P n (F), toda función polinomial g en P n (F) 
es una combinación lineal de elementos de J3 , esto es 

g=ìb<f h 

i=0 

Entonces 


= 2 = bjl 

1=0 

así 

# = 2^(cì)/ì 

i=0 

es la representación única de g como combinación lineal de elementos de 
J3. Esta representación se llama ecuación de interpolación de Lagrange. 
Véase que el argumento anterior muestra que si b 0 , b u . . . , b n son cua- 
lesquiera n -h 1 elementos de F (no necesariamente distintps), entonces 
la función polinomial 

g = 2 bjfi 
i =0 

es el único elemento dé P n (F) tal que g(c } ) = b } . Luego entonces, hemos 
encontrado el único polinomio cuyo grado no excede a n que tiene valores 
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específicos bj en puntos dados c> en su dominio (/ = 0, 1, . .. , n). Por 
ejemplo, construyamos el polinomio real g de grado máximo 2 cuya 
gráfica contiene a los puntos (1, 8), (2, 5) y (3, —4). (Luego, con la 
notación anterior, c 0 = 1, c t = 2, c a = 3, b 0 — 8, b , = 5, y b 3 = —4.) 
Los polinomios de Lagrange asociados a c„, c,, y c. son 


/«(*) 

fi(x) 

y 

ÍÁX) 


(x - 2)(x - 3) 
(1 - 2)(1 - 3) 
(x - l)(x - 3) 
(2 - 1)(2 - 3) 

(x - 1)0 - 2) 
(3 - 1) (3 - 2) 


De aquí, el polinomio deseado es 


\(x- - 5x + 6), 

— 1 O 2 — 4x + 3), 

\(x^ - 3x + 2). 


£(*) = Èbif’(x) - 8 f„(x) + 5 /, 0 ) - HÁx) 

i -0 

- 4(x- - 5x + 6) - 5 (jc- - 4jc + 3) - 2(^ - 3* + 2) 


= — 3jt- + 6x + 5. 


Una consecuencia importante de la ecuación de interpolación de La- 
grange es el siguiente resultado: Si /Ç P„(F) y /(c ; ) — 0 para n + 1 ele- 
mentos diferentes c 0 , c,, . . . , c w en F, / será la función cero. 

E1 siguiente resultado relaciona la dimensión de un subespacio con la 
dimensión del espacio vectorial que la contiene. 


Teorema 1.12. Sea W un subespacio de un espacio vectorial V de dimemión 
n. Entonces , W dimensionalmente-finito y dim( W) < n. Además, si 
dim( W) — n, entonces W — V. 

demostración. Si W = {(9), entonces W es dimensionalmente finito y 
dim(W) = 0 < n. De otra manera, existe un elemento no nulo x x en W, 
y así {jc,} es un conjunto linealmente independiente. Continuando en esta 
forma, tómense elementos x u . . . , x k en W tales que (x,, ... , x&} sea 
linealmente independiente. Este proceso debe terminar en una etapa donde 
{x u ... , x*} sea linealmente independiente pero de manera que al ana- 
dir cualquier elemento de W se tenga un conjunto linealmente dependien- 
te (puesto que ningún subconjunto linealmente independiente de V puede 
contener más de n elementos). Entonces, W tiene una base finita que 
contiene no más de n elementos; esto es, dim(W) < n. 

Si dim(W) = n , entonces una base para W sería un subconjunto de 
V linealmente independiente que contuviera n elementos. Pero el corola- 
rio 1 del Teorema 1.11 implica que la base para W es también una base 
para V y se tiene que W = V. ■ 
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Corolario. Si W es un subespacio de un espacio V dimensiortalmente finito, 
entonces W tiene una base finita y cualquier base para W es un subcon- 
junto de una base para V. 

demostración. E1 teorema muestra que W tiene una base finita S. Si p 
es alguna base para V, entonces existe un subconjunto S x de tal que 
S U Si es una base para V (Teorema 1.11). De aquí que S es un subcon- 
junto de una base para V. ■ 

Podemos utilizar el Teorema 1.12 para analizar geométricamente los 
subespacios de R 2 y R 3 . 

Como R 2 tiene dimensión 2 sobre R , los subespacios de R 2 pueden ser 
solamente de dimensiones 0, 1 ó 2. Los únicos subespacios de dimensiones 
0 ó 2 son {0} y R 2 , respectivamente. Cualquier subespacio de R 2 que 
tenga dimensión 1 consta de todos los múltiplos escalares de algún vector 
no nulo en R 2 (ejercicio 9 de la sección 1.4). 

Si algún punto de R 2 se identifica de manera natural con un punto del 
plano Euclidianó, entonces es posible describir los subespacios de R 2 geo- 
métricamente: Un subespacio de R 2 de dimensión 0 consta del origen del 
plano Euclidiano, un subespacio de R 2 de dimensión 1 consta de una 
recta que pasa por el origen y un subespacio de R 2 que tengan dimensión 
2 es todo el plano Euclidiano. 

Similarmente, los subespacios de R 3 deben tener dimensión 0, 1, 2 ó 
3. Interpretando estas posibilidades geométricamente, vemos que un sub- 
espacio de dimensión cero debe ser el origen del sistema coordenado 
Euclidiano en el espacio, un subespacio de dimensión 1 es una recta que 
pasa por el origen, un subespacio de dimensión 2 es un plano que pasa 
por el origen y un subespacio de dimensión 3 es el mismo espacio Eucli- 
diano de 3 dimensiones. 

Ejemplo 39. Sea W = {(ai, . . . , a 5 ) £ F’: a^ + a 3 + a 5 = 0, a> — a 4 }. 
Entonces W es un subespacio de F 5 con {(1, 0, 0, 0, — 1), (0,0, 1,0, — 1), 
(0, 1, 0, 1, 0)} como una base. Por tanto, la dimensión de W es 3. 

Ejemplo 40. E1 conjunto de las matrices diagonales de n x n forma un 
subespacio W de M nxn (F). (Ver ejemplo 8.) Una base para W es 
{Aí 11 , M 22 , . . . , M nn } donde M ij es la matriz definida en el ejemplo 24. 
Así, la dimensión de W es n. 

Ejemplo 41. Vimos en la sección 1.3 que el conjunto de las matrices 
simétricas de n x n forma un subespacio W de M nxlî (F). Una base para 
W es { A ij : 1 </</<«}, donde A i} es la matriz de n x n que 
tiene 1 en el i-é simo renglón y la j-é sima columna, 1 en el j-é simo renglón 
y z-ésima columna, y 0 en los demás términos. Por tanto, la dimensión de 
W es n + (n — 1) + . . . + 1 = in(n + 1). 
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Ejemplo 42. E1 conjunto de polinomios de la forma a 18 x 18 + ai 6 jc 16 + 
+ . . . + a 2 x 2 + Oo donde Oo, a 2 , . . . , ai R , ai 8 £ F, componen un subes- 
pacio W de Pi 9 (F) de dimensión 10 puesto que (1, x 2 , x 4 , . .. , jc 18 } es 
una base para W. 

Si Wi y W 2 son subespacios de un espacio vectorial V, vimos en la 
sección l.3 que también lo son W-i fì W 2 y W t + W 2 . Es natural preguntar 
si las dimensiones de estos subespacios pueden calcularse directamente a 
partir de las dimensiones de W x y W 2 . Desafortunadamente esto no es posi- 
ble. Existe, sin embargo, una relación entre dim(W! + W 2 ), dim(Wi), 
y dim(W 2 ). 

Teorema 1.13. Sean Wi y W :2 subespacios dimensionalmente finitos de un es- 
pacio vectorial V. Entonces, W x + W 2 es dimensionalmente finito y 

dim(W! + W 2 ) = dim(W!) + dim(W 2 ) - dim(W! n W 2 ). 

demostración. Como Wj D W 2 es un subespacio de un espacio dimen- 
sionalmente finito W u Wi H W 2 tiene una base finita J3 0 = {xi, . . . , x*} 
(Teorema 1.12). Usemos el corolario del Teorema 1.12 para encontrar 
J3i = {yi, • • • , y r ) y = {z u . .. , Zm} tales que J3 0 U j8i sea una base 
para W^ y /?, 0 U J3 2 sea una base para W 2 . Demostraremos que J3 0 U /?i U 
u /3:2 = {x u ... , **, y x , . .. , y r , z u . .. , Zm} es una base para W^ + W 2 . 
Se seguirá que W x + W 12 es dimensionalmente finita y que 

dim(Wi + W. 2 ) = k + r + m— (k + r) + (k + m)— k 
= dim(W0 + dim(W 2 ) - dim(Wi n W l2 ). 

Para demostrar que J3 0 UftU J3 2 es una base para W x + W 2 , demos- 
traremos primero que J3 0 U U /? 2 es linealmente independiente. Supón- 
gase que 

a r x x + . . . + OhX k + ftiyi + . . . + b r y r + c x Zx + . . . + c m Zm = 0 
para algunos escalares a u ... 9 a^ 9 b u ... 9 b r , c a , . . . , c m . Sea 
v 0 = a x x i + . . . + Ofc**, Vi = Z>iyi + . . . + 


y 


v 2 = CiZi + . . . + C m Zm\ 

obsérvese que v 0 € W^ n W 2 , Vi Ç Wi,y v 2 Ç W 2 . La igualdad anterior pue- 
de expresarse como v 0 + Vi + v 2 ( = 0\ así, v 0 + v^ = — v 2 . En esta última 
igualdad el miembro izquierdo es un elemento de W x y el miembro derecho 
es un elemento de W 2 . Entonces — v 2 es tanto un elemento de W x como 
de W 2 , esto es, — v 2 Ç W* n W 2 . Como {jCi, . . . , **} es una base para 
W x H W 2 , existen escalares d u , d* tales que — v 2 = d+Xi + . . . + 
+ <4**. Ahora bien, 
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0 = v 0 + Vi + v 2 

= (<hXi + - . . + a-kXk) + (fciji + . . . + b r y r ) 

+ (-d^Xt - ... - d k X. k ) 

= (a x - d^x, + . . . + (Ofc — <4)* fc + fc,?! + . . . + b r y r . 

Así tenemos una combinación lineal de elementos de 0 O U que es igual 
al vector cero; pero jS 0 U /?! es un conjunto linealmente independiente, y 
así d\ d\ = ... — a k — d k — b x — . = b r — 0. De aquí que v x — 0. 

Entonces 

0 = v 0 + Vi + v 2 = v 0 + v 2 = íiiJC! + . . . + a k x k + CiZi + . . . + c m z m , 

de manera que una combinación lineal de elementos de 0 O U 0 2 es igual 
al vector cero. Como antes, el hecho de que J3 0 U J3 2 sea un conjunto lineal- 
mente independiente implica que — ... — a k = c x — ... — c m = 0. 
Como a x — ... = Ok = b x = ... = b r = c a = ... = c m = 0, hemos de- 
mostrado que /? 0 U 0! U es linealmente independiente. 

Falta demostrar que /? 0 U /4 U J3 2 genera a + W 2 . Pero ahora te- 
nemos que L(J3 0 U J3 X ) = W x y L(/? 0 U /? 2 ) = W 2 puesto que 0 O U J3 X y 
/? 0 U /? 2 son bases para W^ y W 2 , respectivamente. Pero 

L(J3 o U U £ 2 ) - L((J3 0 U 00 U (0 O U 0 2 )) 

= L(0 O U 00 + L(0 O U 0 2 ) 

= Wi + w 2 

por el ejercicio 12 de la sección 1.4. De aquí que 0 O U 0i U J3 2 genera 
a W a + W 2 , lo cual completa la demostración. ■ 

Como una consecuencia inmediata de este resultado, se tiene el si- 
guiente corolario de utilidad. 

Coro/ar/o. Sean W t y W 2 subespacios dimensionalmente finitos de un espacio 
vectorial V tales que V = W, + W 2 . Luego, V es la suma directa de W, 
y W 2 si y sólo si 

dim(y) = dim( W0 + dim( W 2 ). 

Ejemplo 43. Sea c un elemento de un campo infinito F, sea W t el con- 
junto de todas las funciones constantes en P n (F), y defínase como 
W 2 = (f(x) €P n (F); /(c) = 0). Puede verse fácilmente que W x y W 2 
son subespacios de P n (F) y que P n (F) = Wi®W 2 . (Obsérvese que para 
cualesquiera f(x) 6 P ;n (F), g(x) = f(c) 6 Wi, h(x) = /(x) — /(c) Ç_ W 2 , 
y /(jc) = g(;t) + h(x).) Como la función constante p(x) = 1 claramen- 
te constituye una base para W 1? se deduce del corolario anterior que 

dim(W 2 ) = dim(P n (F)) - dim(W!) = (n + 1) - 1 = n. 
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EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) E1 espacio vectorial cero no tiene base. 

(b) Todo espacio vectorial generado por un conjunto finito tiene una 
base. 

(c) Todo espacio vectorial tiene una base finita. 

(d) Un espacio vectorial no puede tener más de una base. 

(e) Si un espacio vectorial tiene una base finita, entonces el número de 
vectores en todas las bases es el mismo. 

(f) La dimensión de P n (F) es n. 

(g) La dimensión de M mxn (F) es m + n. 

(h) Suponer que V es un espacio vectorial dimensionalmente finito, que 
St es un subconjunto linealmente independiente de V y que S 2 es un 
subconjunto de V que genera a V. Luego, S^ no puede tener más 
elementos que 5 2 . 

(i) Si S genera al espacio vectorial V, entonces todo vector en V puede 
escribirse como una combinación lineal de elementos de S de una 
sola manera. 

(j) Todo subespacio de un espacio dimensionalmente finito es dimensio- 
nalmente finito. 

(k) Si V es un espacio vectorial de dimensión n, entonces V tiene exacta- 
mente un subespacio de dimensión 0 y exactamente un subespacio de 
dimensión n. 

(l) Si Wi y W 2 son subespacios dimensionalmente finitos de un espacio 
vectorial, entonces dim(W x + W 2 ) = dim(W!) + dim(W 2 ). 

2 . Determinar cuáles de los siguientes conjuntos son bases para R 3 . 

(a) {(1,0, -1), (2,5, 1), (0, -4,3)} 

(b) {(2, -4, 1), (0,3, -1), (6,0, -1)} 

(c) {(1,2, -1), (1,0,2), (2, 1, 1)} 

(d) {(-1,3, 1), (2, -4, -3), (-3, 8,2)} 

(e) {(1, -3, -2), (-3, 1, 3), (-2, -10, -2)} 

3. Determinar cuáles de los siguientes conjuntos son bases para P 2 (F). 

(a) { - 1 - x + 2x\ 2 + x - 2x\ 1 - 2x + 4jc 2 } 

(b) {1 + 2x + x 2 , 3 + Jt 2 , jc + Jt 2 } 

(c) {1 + 4jc - 2jc 2 , -2 + 3jc - jc 2 , -3 - 12jc + 6jc 2 } 

(d) {-l + 2 jc + 4jc 2 , 3 - 4jc - IOjc 2 , -2 - 5jc - 6x 2 } 

(e) {1 + 2jc — Jt 2 , 4 — 2 jc + x 2 , — 1 + 18* — 9x 2 } 


4. ^Generan los polinomios x Á — 2x 2 + 1, 4x 2 — x + 3 y 3x — 2 a P 3 (F)? 
Justifique su respuesta. 
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5. í,Es {(1. 4, -6), (1, 5, 8), (2, 1, 1), (0, 1, 0)} un subconjunto lineal- 
mente independiente de R 3 ? Justifique su respuesta. 


6 . Dar tres bases diferentes para F 2 y para M 2 x 2 (F). 

7. Los vectores x, =(2, —3, 1), x 2 = (1, 4, —2), x 3 — ( — 8, 12, —4), 
x< = (1, 37, -17), yi s = (-3, -5, 8) generan a R 3 . Encontrar un sub- 
conjunto de {x„ x 2 , x 3 , x t , x 3 ) que sea una base para R 3 . 


8 . Sea V el espacio vectorial que consta de todos los vectores de R 5 para los 
cuales la suma de las coordenadas es cero. Los vectores 


x 3 = (2, -3, 4, 
* 3 = (3, -2, 7, 
x 5 = (-1, 1, 2, 
= ( 1 , 0 , - 2 , 


-5,2), 

x 2 = (- 

-9, 1), 

x, = (2, 

l. -3), 

Xe = (0, 

5, -2), 

Xi = (2, 


■, 9, -12, 15, -6), 
- 8 , 2 , - 2 , 6 ), 

-3, -18, 9, 12), 
-1, 1, -9,7) 


generan a V. Encontrar un subconjunto de {jc,, . . . , x s } que sea una base 
para V. 


9. Los vectores JCi = (1, 1, 1, 1), x 2 = (0, 1, 1, 1), x 3 = (0, 0, 1, 1), y 
x 4 = (0, 0, 0, 1) forman una base para F 4 . Encontrar la única representa- 
ción de un vector arbitrario (a„ a 2 , a 3 , a,) en F 4 como combinación lineal 
de los vectores x 2 , x 3 , y x,. 

10 . Sea 

V = M 2x 2 (F), Wl= {(c a) €V: a. 

y 

w '={(-° ?) ev: 

Demostrar que Wi y W 2 son subespacios de V y encontrar las dimensiones 
de W 5 , W 2 , W t + W 2 , y W x fì W 2 . 


lî.* Sea V un espacio vectorial de dimensión n y sea S un subconjunto de V 
que genera a V. 

(a) Demostrar que S contiene al menos n elementos. 

(b) Demostrar que un subconjunto de S es una base para V. (Tenga cui- 
dado de no suponer que S sea finito.) 

12. Sean W t y W 2 subespacios de un espacio vectorial V de dimensiones m y n, 
respectivamente, donde m > n . Demostrar que dim(Wi n W 2 < n y 
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dim ( w i + W 2 ) < m + n. Dar ejemplos de subespacios de R 3 donde cada 
desigualdad se convierta en igualdad. 

13. Sea { x , y} una base de un espacio vectorial V. Mostrar que tanto {x + y , 
x — y} como {ax, by} son bases para V, donde a y b son escalares arbi- 
trarios no nulos. 

14. Suponer que V es un espacio vectorial con una base {x u x 2 , x 3 }. Demostrar 
que {Xi + * 2 + x :h x 2 + * 3 , x 3 } también es una base para V. 

15. E1 conjunto de soluciones para el sistema 

f — 2x 2 + x 3 = 0 
\2xì — 3x 2 + x 3 — 0 

es un subespacio de R 3 . Encontrar una base para este subespacio. 

16. Encontrar bases para los siguientes subespacios de F r> : 

= {(a u a 2 , a a , a 4 , a 5 ) Ç F 5 : a x - a 3 - a 4 = 0} 

y 

W 2 = {(a u a 2 , a 3 , a 4 , a 5 ) £ F 5 : a 2 = a 3 = a 4 , a x + a 5 = 0}. 

^Cuáles son las dimensiones de W^ y W 2 ? 

17. E1 conjunto de todas las matrices de n x n cuya^ traza es igual a cero es 
un subespacio W de M nxn (F). (Ver Ejemplo 1.1.) Encontrar una base para 
W. ^Cuál es la dimensión de W? 

18. E1 conjunto de todas las matrices triangulares de n x n es un subespacio 
W de M nKn (F). (Ver Ejercicio 12 de la Sección E3.) Encontrar una base 
para W. Cuál es la dimensión de W? 

19. E1 conjunto de todas las matrices antisimétricas de n x n es un subespacio 
W de M Ilxn (F). (Ver Ejercicio 25 de la Sección 1.3.) Encontrar una base 
para W. ^Cuál es la dimensión de W? 

20. (a) Sean W^ y W 2 subespacios de un espacio vectorial V tales que 

V — W! ® W 2 . Si fíì y /? 2 son bases para Wj y W 2 , respectivamente, 
demostrar que fìi (~ì J3 2 — 0 y que U J3 2 es una base para V. 

(b) Recíprocamente, sean y fì 2 bases disjuntas para subespacios W 2 y 
W 2 , respectivamente, de un espacio vectorial V. Demostrar que si 
fii U y? 2 es una base para V, entonces V = W^ ® W 2 . 

21. Completar la demostración del Teorema 1.9. 
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22. Sea W un subespacio de un espacio vectorial dimensionalmente finito V. 
Determinar la dimensión del espacio vectorial V/W, el espacio cociente de 

V módulo W. (Ver Ejercicio 29 de la Sección 1.3.) Justifique su respuesta. 

23. Encontrar una base para el espacio vectorial de sucesiones no nulas en un 
campo F. (Ver ejemplo 5.) 

24. Demostrar que si. W : es un subespacio cualquiera de un espacio vectorial 
dimensionalmente finito V, entonces existe un subespacio W 2 de V: tal que 

V = W, ® W 2 . 

25. Demostrar que un espacio vectorial es dimensionalmente infinito si y sólo 
si contiene un subconjunto infinito linealmente independiente. 


1.7 * SUBCONJUNTOS MAXIMOS LINEALMENTE INDEPENDIENTES 

En esta seceión extenderemos algunos resultados importantes de la sec- 
ción 1.6 de manera que incluyan espacios vectoriales dimensionalmente 
infinitos. Nuestra meta principal es demostrar que todo espacio vectorial 
tiene una base. Este resultado es fundamental para el estudio de espacios 
vectoriales dimensionalmente infinitos, ya que a menudo es extremada- 
mente difícil construir explícitamente una base para tales espacios. 

La dificultad que surge al expandir los teoremas de la sección anterior 
a espacios dimensionalmente infinitos es que el principio de inducción 
matemática, que jugó un papel fundamental en muchas de las demostra- 
ciones de la sección 1.6, ya no es válido. En vez de ello, utilizaremos un 
principio más general llamado principio de maximidad, el que requiere 
de la siguiente terminología. 

Definición. Sea 7 una familia de conjuntos. Un miembro M de 7 se llama máxi- 
mo (en relación con la inclusión de conjunto), si ningún miembro de 7 
contiene propiamente a M. 

Ejemplo 44. Sea 7 la familia de todos los subconjuntos de un conjunto 
no vacío S (7 se denomina conjunto potencia de S). Se puede ver fácil- 
mente que S es el elemento máximo de 7. 

Definición. Una colección de conjuntos C se denomina cadena si, para cada 
par de conjuntos A y B en C, se tiene que A Q B o B C A. 

Ejemplo 45. Sea A n el conjunto que consta de los enteros 1,2,...,«. 
Entonces C = {A n : n — 1, 2, 3, . . .} es una cadena; de hecho A m Q A n 
si y sólo si m < n. 
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Con esta terminología ya podemos expresar el principio de maxi- 
midad. 

Principio de Maximidad. Sea J una familia de conjunîos. Si, para cada cade- 
na C C J, existe un miembro de J que contiene a cada uno de los miem- 
bros de 6, entonces J contiene un elemento máximo. 

Como el principio de maximidad garantiza la existencia de elementos 
máximos en una familia de conjuntos, será útil reformular la definición 
de una base en términos de la propiedad de maximidad. Demostraremos 
posteriormente que esta reformulación es equivalente a la definición origi- 
nal de base. 

Definición. Sea S un subconjunto de un espacio vectorial V. Un subconjunto 
máximo linealmente independiente de S es un subconjunto B de S que 
satisface las siguientes condiciones: 

(a) B es linealmente independiente. 

(b) Cualquier subconjunto de S que contenga propiamente a B es 
linealmente dependiente. 

Ejemplo 46. E1 ejemplo 16 muestra que (jc 3 - 2x 2 — 5x - 3, 3x 3 — 
— 5x 2 — 4x — 9} es un subconjunto máximo linealmente independiente 
de 

5 = [2x 3 - 2x 2 + Ì2x - 6, x 3 - 2x 2 - 5x ~ 3, 3x 3 - 5x 2 - 4x - 9} 

en P 3 (#). En este caso, sin embargo, se puede demostrar fácilmente que 
cualquier subconjunto de dos elementos de S es un subconjunto máximo 
linealmente independiente de S. De aquí que los subconjuntos máximos li- 
nealmente independientes de un conjunto no necesariamente son únicos. 

Una base /? para un espacio vectorial V es un subconjunto máximo îi- 
nealmente independiente de V, ya que: 

(a) J3 es, por definición, linealmente independiente. 

(b) Si x £ V, x $ /3, entonces U (x) es linealmente independiente 
de acuerdo con el lema del Teorema 1.10, puesto que L(f3) = V. 

Nuestro siguiente resultado muestra que la recíproca de este argumento 
también es verdadera. 

Teorema 1.14 . Sea S un subconjunto de un espacio vectorial V tal que S gene- 
ra a V, y sea /3 un subconjunto máximo linealmente independiente de S. 
Entonces /3 es una base para V. 

DEMOSTRACIÓN. Puesto que f3 es linealmente independiente, es suficiente 
demostrar que J3 genera a V. Supóngase que S C L(f3)\ entonces existe 
x Ç S tal que x $ L(,/3). Pero entonces el lema del Teorema 1.10 implica 
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que /3 U {*} es linealmente independiente, lo que es una contradicción a 
la maximidad de /?. Luego entonces S Ç L(f3). Por tanto, como L(S) = V, 
se tiene del ejercicio 11 de la sección 1.4 que L(f3) — V. ■ 

Corolario. Un subconjunîo {3 de un espacio vectorial V es una base para V 
si y sólo si /3 es un subconjunto máximo linealmente independiente de V. 

En vista de nuestro corolario anterior, podemos llegar a asegurar que 
todo espacio vectorial tiene una base al demostrar que todo espacio vecto- 
rial contiene un subconjunto máximo linealmente independiente. Este re- 
sultado se deduce de una manera inmediata a partir de nuestro siguiente 
teorema. 

Teorema 1.15 . Sea S un subconjunto linealmente independiente de un espacio 
vectorial V. Existe un subconjunto máximo linealmente independiente de 
V que contiene a S. 

demostración. Sea ‘J la familia de todos Ios subconjuntos linealmente 
independientes de V que contienen a S. Utilizaremos el principio de maxi- 
midad para demostrar que J contiene un elemento máximo. Con el objeto 
de aplicar el principio de maximidad debemos demostrar que si C es pna 
cadena en J, entonces existe un miembro U de 7 que contiene a cada 
miembro de C. Demostraremos que U, la unión de los miembros de C, es 
el conjunto deseado. Como es evidente que U contiene a cada miembro 
de C, basta con demostrar que U £ J, es decir, que U es un subconjunto 
linealmente independiente de V que contiene a S. Ahora bien, cada ele- 
mento de C es un subconjunto de V que contiene a S; de aquí S C U C V. 
Para demostrar que U es linealmente independiente, sean u { , ... , u„ vec- 
tores en U y c u . . . , c n escalares tales que c x u j + . . . + c n u„ = 0. Como 
u t £ U para i = 1, . . . , n, existen conjuntos A { en C tales que u, £ A 
Pero como C es una cadena, uno de los conjuntos A u ... , A n , por ejem- 
plo A k , contiene a los demás. Entonces u u . . . , u n £ A k para i = 1, . .. , n. 
Sin embargo, A k es un conjunto linealmente independiente, de manera que 
CiW, + . . . + c n u n = 0 implica que c x = . . . = c„ = 0. Por lo tanto, U 
es linealmente independiente. 

El principio de maximidad implica que J contiene un elemento máxi- 
mo, y se ve fácilmente que este elemento máximo es un subconjunto 
máximo linealmente independiente de V que contiene a S. ■ 

Corolario. Todo espacio vectorial tiene una base. 

Puede demostrarse, de una manera semejante a la del Corolario 3 del 
Teorema 1.11, que toda base para un espacio vectorial dimensionalmente 
infinito tiene la misma cardinalidad. (Consultar, por ejemplo, a N. Jacob- 
son, Lecturas sobre Algebra Lineal , III, pág. 154, D. Van Nostrand Com- 
pany, Nueva York, 1964.) 



60 Espacios vectoriales 


Los ejercicios 2 a 5 extienden otros resultados de la sección 1.6 para 
incluir espacios dimensionalmente infinitos. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Toda familia de conjuntos contiene un elemento máximo. 

(b) Toda cadena contiene un elemento máximo. 

(c) Si una familia de conjuntos tiene un elemento máximo, entonces tal 
elemento máximo es único. 

(d) Si una cadena de conjuntos tiene un elemento máximo, entonces tal 
elemento máximo es único. 

(e) Una base de un espacio vectorial es un subconjunto máximo lineal- 
mente independiente de ese espacio vectorial. 

(f) Un subconjunto máximo linealmente independiente de un espacio vec- 
torial es una base para tal espacio vectorial. 

2. Sea W un subespacio de un espacio vectorial V (no necesariamente dimen- 
sionalmente finito). Demostrar que cualquier base para W es un subcon- 
junto de una base para V. 

3. Demostrar la siguiente versión dimensionalmente infinita del Teorema 1.9: 
Sea /? un subconjunto de un espacio vectorial V dimensionalmente infinito. 
Entonces /3 es una base para V si y sólo si para cada vector y no nulo en 
V existen vectores únicos x u . . . , x n en J3 y escalares no nulos únicos 
Ci, . . . , c n tales que y = c t Xi + . .. + c n x n . 

4. Demostrar la siguiente generalización del Teorema 1.10: Sean S , y S> sub- 
conjuntos de un espacio vectorial V tales que Ç S 2 . Si es linealmente 
independiente y S 2 genera a V, entonces existe una base /3 para V tal que 
Si C /3 C S 2 . Sugerencia: Aplicar el principio de maximidad a la familia 
de todos los subconjuntos linealmente independientes de S 2 que contienen 
a y proceder como se hizo en la demostración del Teorema 1.15. 

5. Demostrar la siguiente generalización del Teorema 1.11. Sea (3 una base 
para un espacio vectorial V y sea S un subconjunto linealmente indepen- 
diente de V. Existe un subconjunto S x de J3 tal que S U es una base 
de V. 
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Capítulo 2 


Transformaciones lineales 
y matrices 

En el capítulo 1 desarrollamos la teoría de espacios vectoriales abstractos 
con bastante detalle. Ahora es natural considerar a aquellas funciones defi- 
nidas en espacios vectoriales que en cierto sentido “conservan” la estruc- 
tura; estas funciones especiales se denominan “transformaciones lineales” 
y son abundantes en las matemáticas puras como en las aplicadas. En el 
cálculo, las operaciones de diferenciación e integración nos proporcionan 
dos de los ejemplos más importantes de transformaciones lineales (ver 
ejemplos 1 y 2). Estos dos ejemplos nos permiten reformular muchos de 
los problemas de ecuaciones diferenciales e integrales en términos de trans- 
formaciones lineales en espacios vectoriales particulares (ver las seccio- 
nes 2.7 y 5.2). 

En geometría, las rotaciones, reflexiones y proyeceiones (ver ejem- 
plos 5, 6 y 7) nos proporcionan otra clase de transformaciones lineales, 
las que utilizaremos posteriormente para estudiar los movimientos rígidos 
en R 11 (sección 7.8). 

En los capítulos restantes veremos ejemplos adicionales de transforma- 
ciones lineales en las ciencias físicas y sociales. 

A lo largo de este capítulo supondremos que todos los espacios vecto- 
riales están definidos sobre un campo ordinario F. 


2.1 TRANSFORMACIONES LINEALES, ESPACIOS 
NULOS Y RANG OS 

En esta sección consideraremos un gran número de ejemplos de trans- 
formaciones lineales, muchas de las cuales serán estudiadas con más de- 
talle en secciones posteriores. 

Definición. Sean V y W espacios vectoriales (sobre F). Una función T: VW 
se lîama transformación lineal de V en W si para toda x, y£Vyc£F 
tenemos que 
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(a) T(x + y) = T(x) + T(y). 

(b) T(cx) = cT(x). 

A menudo denominaremos a T simplemente lineal. E1 lector deberá 
verificar los siguientes hechos sobre la función T: V-^W. 

1. Si T es lineal, entonces T (0) = 0. 

2. T es lineal si y sólo si T (ax + y) = aT(x) + T(y) para toda 
x, y € V y a £ F. 

3. T es lineal si y sólo si para ( V y a„ F te- 

nemos que 

T(2 a.Xi) = 2 aJUi). 

i - 1 t - 1 

Generalmente utilizaremos la propiedad 2 para demostrar que una 
transformación dada es lineal. 

Ejemplo 1. Sea V = P„(f?) y W = P n ,(R) y defínase T: V-> W me- 

diante T(/) = /', donde /' es la derivada de /. Para demostrar que T es 
lineal, sean g y h vectores en P„(f?) y a£ R. Tenemos que T (ag + h) — 
= ( ag + h)' = ag' + h' = aT(g) +T()j). Entonces, de acuerdo con la 
propiedad 2, T es lineal. 

Ejemplo 2. Sea V = C(R) el espacio vectorial de funciones continuas 
de variable real en R. Sean a, b£ R, a<b y defínase T: V-nvfl me- 

diante T(/) = / f(t)dí para toda / Ç V. Entonces, por las propiedades 

J a 

elementales de las integrales, T es una transformación lineal. 

Dos ejemplos muy importantes de’transformaciones lineales que pue- 
den aparecer a menudo en el resto del libro y que, por tanto, merecen 
tener una notación propia, son la transformación identidad y la transfor- 
mación cero. 

Para espacios vectoriales V y W (sobre F) definimos la transformación 
identidad I : V mediante I v (x) = x para toda * Ç V y la transfor - 

mación cero T 0 : V —> W por T 0 (^) = 0 para toda x Ç_ V. Es evidente que 
ambas transformaciones son lineales. A menudo escribiremos I en vez 
de ! v . 

Veremos ahora algunos ejemplos adicionales de transformaciones li- 
neales. 

Ejemplo 3. Defínase 

T: R 2 R 2 por T (a u a z ) = (2a, + a>, a,). 

Para demostrar que T es lineal, sean 
x > y€ R % x = (b u b 2 ), 


y = (di, d 2 ), y sea cÇF. 


Transformaciones lineales, espacios nulos y rangos 65 


Como 


cx + y = (còi + d u cb, 4- d 2 ), 


tenemos 

T(cjc + y) = (2(cZ?! + c/i) + cb 2 + d 2 , cfei -f di). 

También 


cT(x) + T-00 - c(26i + fc 2 , 61 ) + (2^1+ d 2 , rfi) 

= ( 2 cfci + cò 2 + 2d x + d 2 , cb x + dO 
- (2(cè x + rfO + cò 2 + J 2 , cb 1 + í/O. 


Por lo tanto, T es lineal. 


Ejemplo 4. Defínase T: AA mxn (F) —> M mxn (F) mediante T(/4) — -4*, 
donde A f es tal como se definió en la Sección 1.3. Entonces, T es una 
transformación lineal por el ejercicio 3 de la Sección 1.3. 

Como veremos en las Secciones 7.7 y 7.8, las aplicaciones del álgebra 
lineal a la geometría son vastas y variadas. La razón principal de esto es 
que la mayor parte de las transformaciones geométricas son lineales. Tres 
transformaciones particulares que ahora consideraremos son la rotación, 
la reflexión y la proyección. Dejaremos al lector las demostraciones de 
linealidad. 


Ejemplo 5. Para 0 < 0 < 2w definamos T e : R 2 R 2 mediante 
T e (a l9 a 2 ) = (ui cos 6 — a 2 sen 6 , a x sen 6 + a 2 cos 9 ). 

T e se denomina roîación en 6. (Ver Fig. 2.1 (a).) 

Ejemplo 6. Defínase T: R 2 —> R 2 mediante T (a u a 2 ) = ( a l9 — a 2 ). T se 
denomina rejlexión en torno al eje x. (Ver Fig. 2.1 (b).) 

Ejemplo 7. Defínase T: R 2 R 2 mediante T(^!, a 2 ) = (a u 0). T se de- 
nomina proyección sobre el eje x. (Ver Fig. 2.1 (c).) Nótese que si hacemos 
W x = {(u, 0): R) y W 2 = {(0, a) : a£ R) entonces R 2 = W x © W 2 , 


X 


(a) 




(b) (c) 

figura 2.1 
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por lo que para toda x € R 2 existen vectores únicos jc x € W x y jc 2 Ç W 2 
tales que jc = x x + x 2 y T(jc) = jc lt 

E1 ejemplo 7 sugiere la siguiente definición. 

Definición. Sean V un espacio vectorial y un subespacio de V. Una función 
T: V —> V se llama proyección sobre W^ si 

(a) Existe un subespacio W 2 tal que V = Wi ® W 2 

(b) Para x = Xt + x 2 , donde x^Ç Wjx 2 ( W 2 , tenemos T(x) — x l# 

Se deja como ejercicio para el lector demostrar que T es lineal y que 
W x = {x: T(jc) = Jt}. 

Ahora supóngase que existe un subespacio W' ^ W 2 tal que V — 
Wi © W'. Defínase U: V V mediante U(x) — donde jc = jti + x' 2 , 
*i 6 Wi, y jc 2 Ç W'. Entonces, U es otra proyección sobre W^ y de nuevo 
Wi = {x: U(jc) = jc}. Por ejemplo, en el Ejemplo 7 sea 

W' 2 - {( 11 , a): R} 9 

tal que 

(« 1 , <h) = («1 “ « 2 , 0) + (a 2 , a 2 ) y U(a l5 a 2 ) = (a^ - a 2 , 0). 

Entonces existen tantas proyecciones en Wi como subespacios en W 2 
que satisfacen V = W^ © W 2 . Veremos en el Capítulo 7 que la proyec- 
ción descrita en la figura 2.1 (c) es la proyección “natural” a ser estudiada. 
Este tipo de proyección se llamará “proyección ortogonal” y está deter- 
minada de manera única por el subespacio W lt 

En el Ejercicio 14 de la Sección 2.3 se dará una caracterización de las 
proyecciones, la que nos permitirá determinar fácilmente si una transfor- 
mación lineal es o no una proyección. 

Ahora pondremos atención a dos conjuntos muy importantes asociados 
con las transformaciones lineales: el “rango” y el “espacio nulo”. La de- 
terminación de estos conjuntos nos permitirá examinar más de cerca las 
propiedades intrínsecas de una transformación lineal. 

Definiciones. Sean V y W espacios vectoriales y sea T: V —» W lineal. Defini - 
mos al espacio nulo (o kernel) N(T) de T como el conjunto de todos los 
vectores x en V tal que T(x) = 0; es decir, N(T) = {x € V: T(x) = 0}. 
Definimos al rango (o imagen) R(T) como el subconjunto de W que consta 
de todas las imágenes (bajo T ) de los elementos de V; es decir, R(T) = 
{T(x): x Ç V}. 

Ejemplo 8. Sean V y W espacios vectoriales y sean I: V—>V y T 0 : 
V —> W respectivamente las transformaciones identidad y cero, tal como 
se definieron anteriormente. Entonces N(l) = {t?}, R(l) = V, N(T 0 ) = V 
y R(T 0 ) = { 0 }. 
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Ejemplo 9. Sea T: R 3 R 2 definida mediante T(a,, a 2 , = («! — a 2 , 

2í 7 3 ). Se deja como ejercicio verificar que N(T) = {(a, a, 0): aÇ_ R} y 
R(T) = R-. 

En el ejemplo 7 se ve fácilmente que los subespacios W, = R(T) y 
W 2 = N(T). EI teorema siguiente nos dice que éste es el caso para todas 
las proyecciones. 

Teorema 2.1 . Sea V un espacio vectorial y W^ un subespacio de V. Sea T una 
proyección sobre \N U y sea W 2 tal como en la dejMÌción de proyeccion. 
Entonces 

W a = R(T) y W 2 = N(T). 

demostración. Como se observó anteriormente, W L = { x : T(jc) = x}. 
Por lo tanto, W^ Ç R(T). Si jc£R(T), entonces: x = T(y) para alguna 
y Ç V. Pero y — y t + y 2 , donde y, £Wj y y 2 £ W 2 , y entonces == y t . Por 
lo tanto, W, = R(T). 

Como es evidente que W 2 Ç N(T), únicamente necesitamos demostrar 
que N(T) Ç W 2 . Con este fin, sea xÇN(T). Entonces jc = x A 4- x 2 con 
*i €W t y x-j ÇW 2 . Así, 0 = T(jc) = x l9 y por lo tanto x — jc 2 £W 2 . ■ 

Este teorema nos dice que W 2 queda determinada de manera única por 
la proyección de T sobre W,. Además, como T es una proyección sobre 
su rango, utilizaremos sencillamente el término “proyección” sin mencio- 
nar aí subespacio W,. 

Acabamos de observar en el caso en que T es una proyección que N(T) 
y R(T) son subespacios de V. Puede obtenerse el mismo resultado con 
cualquier transformación lineal. 

Teorema 2.2 . Sean V y W espacios vectoriales y T: V W lineaï. Entonces 
N(T) y R(T) son subespacios de V y W, respectivamente. 

demostración. Para aclarar la notación, usaremos los símbolos 0 V y 
0 W para denominar, respectivamente, a los vectores cero de V y W. 

Como T(0 V ) = 0 W , tenemos que 0 V e N(T). Sean x,ÇN(T) y 
c£ F. Entonces T(x + y) = T(x) + T(y) = 0 W + 0 W = 0 W , y T(cx) = 
cT(jc) = c0 w = 0 W . Por lo tanto x + y£N(T) y cxÇN(T), de manera 
que N(T) es un subespacio de V. 

Como T(0 V ) = 0 W , tenemos que 0 W Ç R(T). Ahora sean x, yÇ R(T) 
y cÇF. Entonces, existen v y w en V tales que T(v) = jc y T(w) >= y. 
Así, T(v + vv) = T(v) + T(w) = x + y, y T(cv) = cT(v) = cx. Por lo 
tanto, x + y£R(T) y cjjÇR(T), de manera que R(T) es un subespacio 
de W. ■ 

Tal como en el Capítulo 1, mediremos el “tamano” de un subespacio 
por su dimensión. Los dos subespacios anteriores son tan importantes que 
dedicaremos atención especial a sus dimensiones respectivas. 
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Definiciones. Sean V y W espacios vecíoriales y sea T: V—»W lineal. Si 
N(T) y R(T) son dimensionalmente finitos , entonces definimos la nulidad 
de T, expresada como nulidad(T), y e/ rango de T, expresado como ran- 
go(T), como /ay dimensiones de N(T) y R(T), respectivamente. 

Reflexionando sobre la acción de una transformación lineal, vemos in- 
tuitivamente que mientras más grande es la nulidad menor es el rango. 
En otras palabras, mientras más vectores van a dar al cero, menor es el 
rango. E1 mismo razonamiento nos dirá que mientras más grande sea 
el rango, menor es la nulidad. Este balance entre el rango y la nulidad se 
hará más preciso en el teorema siguiente. 

Teorema 2.3. Sean V y W espacios vectoriales y sea T: V-* W lineal. Si V 
es dimensionalmente finito, entonces nulidad( T) + rango( T) = dim(V). 

demostración. Supóngase que dim(V) = n, y sea [x u . .. , una 
base para N(T). Por el corolario del Teorema 1.12 podemos extender 
(*i> • •. , x k ) a una base /? = [x u ... , x n } para V. E>emostraremos que 
el conjunto S = {T(x k+1 ), . .. , T(x n )} es una base para R(T). 

Primero demostraremos que S genera a R(T). Sea y £ R(T). Entonces 
existe xÇV tal que y = T(x). Como ft es una base para V, tenemos que 

n 

x = 2 «ì*ì para algunas a u , a n £F. 

i = l 

Como T es lineal se tiene que 

y = T(jr) = 2 oJUi) = 2 aJ(JC { ) €L(5) 

i = l i “fc.f. 1 

La última igualdad se obtiene de que x u ... , ** £ N(T). 

Ahora demostraremos que S es linealmente independiente. Supóngase 
que 

n 

2 MC*ì)= 0 para b k+u ... , b n £F. 

*=fc +1 

De nuevo, utilizando el hecho de que T es lineal, tenemos que 
/ T( 2 b iXî ) = 0. 

i = k + i 

Entonces 


2 biXi £ N(T). 

i=fc+ 1 

Por lo tanto existen c u . . . , c k £F tales que 

n k k n 

2 bai = 2 CìXì o bien 2 (— Cì)xì + 2 &ì*ì — 0 . 

i=fc+l i = 1 i = 1 i = fc + l 
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Como /3 es una base para V, tenemos que b { = 0 para toda /. Por lo tan- 
to, S es linealmente independiente. ■ 

La demostración anterior permite obtener el corolario siguiente. 

Corolario. Sean V y W espacios vcctoriales y sea T: V W lineal. Si V liene 
una base /3 = [x l9 . . . , x n }, entonces R(T) = L(T(/?)) = L({T(xO, . .. , 
T(x n )}). 

Este corolario nos dice que la imagen de una base para el dominio de 
una transformación lineal es un conjunto generador para el rango de la 
transformación. Por lo tanto, este corolario proporciona un método para 
encontrar una base para el rango de una transformación lineal. Empleare- 
mos esta técnica en el ejemplo siguiente. 

Ejemplo 10. Defínase la transformación lineal T: P 2 (R) —> M 2X 2 (JO 
mediante 

Tm = /7<D-«2> 0) 

” { 0 !«»)' 

Como j8 = {1, x, x 2 } es una base para P 2 (/?), tenemos 

R(T) = L (T(j8)) = L({T(1), T(at), T(* 2 )}) 

- ({(::>(-::)}> 

Entonces, hemos encontrado una base para R(T) y vemos que 
rango(T) = 2. En virtud del Teorema 2.3 tenemos que nulidad(T) + 
2 = 3, y entonces nulidad(T) = 1. 

E1 lector debería repasar los conceptos de “uno-a-uno” y “sobreyec- 
tividad” los cuales se encuentran en el Apéndice B, pues, interesantemen- 
te, para una transformación lineal ambos conceptos están íntimamente 
ligados con el rango y la nulidad de la transformación. Esto quedará de- 
mostrado en los dos teoremas siguientes. 

Teorema 2.4. Sean V y W espacios vectoriales y sea T: V W lineal. Enton- 
ces T es uno-a-uno si y sólo si N(T) = {0}. 

demostración. Supóngase que T es uno-a-uno y que xÇN(T). Entonces 
T(x) = 0 = T(0). Como T es uno-a-uno, tenemos que x = 0 y por tanto 
N(T) = {0}. 
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Ahora supóngase que N(T) = (0) y que T(jc) — T(y). Entonces 
0 — T(a:) — T(y) = T(jc — y). Por lo tanto, jc — y£N(T) = {0} y en- 
tonces jc — y = 0, o sea jc — y. Esto significa que T es uno-a-uno. ■ 

E1 lector debe observar que el Teorema 2.4 nos permite concluir que 
la transformación definida en el Ejemplo 10 no es uno-a-uno. 

Sorpresivamente, las condiciones para que una transformación sea uno- 
a-uno y sobreyectiva son equivalentes en un caso especial de importancia. 

Teorema 2.5. Sean V y W espacios vectoriales de dimensiones iguales (finitas) 
y sea T: V -» W lineal. Entonces T es uno-a-uno si y sólo si T es sobre - 
yectiva. 

demostración. Del Teorema 2.3 tenemos que 

nulidad(T) -f rango(T) = dim(V). 

Ahora, mediante el uso del Teorema 2.4, tenemos que T es uno-a-uno si 
y sólo si N(T) = (0), si y sólo si nulidad(T) = 0, si y sólo si rango(T) = 
dim(V), si y sólo si rango(T) = dim(W), si y sólo si dim(R(T)) = 
dim(W). En virtud del Teorema 1.12 esta igualdad es equivalente a 
R(T) = W—la definición de T si ésta es sobreyectiva. ■ 

La linealidad de T en los Teoremas 2.4 y 2.5 es esencial puesto que 
es fácil construir ejemplos de funciones de R en R que no sean uno-a-uno 
pero que sean sobreyectivas, y viceversa. 

Los siguientes dos ejemplos hacen uso de los teoremas anteriores para 
ver si una transformación lineal dada es uno-a-uno o sobreyectiva. 


Ejemplo 11. Defínase 
T: P,(R)-±P :ì (R) 


mediante 


T (/)(*) = 2'/'(x) + 


Ahora 


R(T) = L({T(1), T(jc), T(jcO}) = L({3x, 2 + %jc 2 , 4x + x 3 }). 

Por lo que rango(T) = 3. Como dim(P A (R)) “ 4, T no es sobreyectiva. 
Del Teorema 2.3, nulidad(T) +3 = 3; por tanto, nulidad(T) = 0 y en- 
tonces N(T) = {0}. Luego, de acuerdo con el Teorema 2.4, T es uno-a-uno. 


Ejemplo 12. Defínase 

T: F- F 2 mediante T (a u a>) — (a> f a„ a { ). 


Es fácil comprobar que N(T) = {0}; entonces T es uno-a-uno, por lo que 
el Teorema 2.5 nos dice que T debe ser sobreyectiva. 
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Nuestro siguiente teorema proporciona una caracterización de Ias trans- 
formaciones lineales uno-a-uno como aquellas transformaciones que conser- 
van la independencia lineal. 

Teorema 2.6. Sean V y W espacios vectoriales, y sea T: V —» W lineal. Enton- 
ces T es uno-a-uno si y sólo si T lleva subconjuntos linealmente indepen- 
dientes de V a subconjuntos linealmente independientes de W. 

demostración. Ejercicio. 

Corolario. Sean V y W espacios vectoriales y sea T: V^W una transjorma- 
ción lineal uno-a-uno . Supóngase que S es un subconjunto de V. Entonces 
S es linealmente independiente si y sólo si T(S) es linealmente indepen- 
diente 

demostración. Ejercicio. 

Ejemplo 13. Defínase 

T: P:>(/0 -> R 3 mediante T (a 0 + a,x + a 2 x 2 ) = (a 0 , a u a- 2 ). 

Se ve claramente que T es uno-a-uno. Sea S = {2 — x + 3jc 2 , a: + a: 2 , 1 — 
2+}. Entonces 5 es linealmente independiente en P 2 (/?) si y sólo si 

T(5) - {2, -1,3), (0, 1, 1), (1,0, -2)} 

es linealmente independiente en RT 

En el Ejemplo 13 transferimos un problema del espacio vectorial de 
los polinomios a un problema en el espacio vectorial de las ternas (3-di- 
mensionales). Esta técnica será explotada después más ampliamente. 

Una de las propiedades más importantes de las transformaciones linea- 
les es que quedan completamente definidas por su acción sobre una base. 
Este resultado, que se obtiene del siguiente teorema y su corolario, se 
utilizará frecuentemente a lo Iargo del libro. 

Teorema 2.7. Sean V y W espacios vectoriales y supóngase que V es un 
espacio vectorial dimensionalmente jinito con una base {x u . . . , x u }. Para 
cualquier subconjunto {y l9 . . . , y n } de W existe exactamente una transjor- 
mación lineal T: VW tal que T(x,) — y { para i = 1, . . . , n. 

demostración. Sea x £ V. Entonces 

n 

x = 2 «ì*ì, 

i -1 

donde a l9 ... 9 a n son escalares únicos. Defínase 


n 


T: V ^ W mediante T (x)='2 t a i yi. 
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(a) T es lineal, pues supóngase que u, v£V y d£F. Entonces pode- 
mos escribir 

n n 

u — 2 biXi y v = 2 CiJri. 

i-1 Ì=1 

Ahora bien, 

n 

+ V = 2 (dbi + Ci)Xi. 

i = 1 

Entonces 

T (du + v) = 2 (dbi + Ci)yi - d 2 b t y f + 2^» = dl(u) + T(v). 

i = l i = 1 i=1 

(b) Es evidente que 

TUi) = y-> para i = 1, . .. , n. 

(c) T es única, porque supóngase que U: VW es lineal y 
U(jcì) = y t para / = 1, ... , n. Entonces para x Ç V con 

n 

X = 2 UiXi 

i = 1 

tenemos 

U(j:) = 2 aiU(Xi) = 2 «0^ = T(j:). 

i = l i = 1 

Por lo tanto U = T. ■ 

Corolario. Sean V y W espacios vectoriales y supóngase que V es dimensional - 
mente finito con una base {xj, . . . , x n }. Si U, T: V—> W lineales y 

U(Xj) = T(Xi) para i = 1, . .. , n, entonces U = T. 

Ejemplo 14. Defínase T: R 2 mediante T(aj, a 2 ) = (2a 2 — a lf 3a0, 

y supóngase que U: R 2 R 2 es lineal. Si sabemos que U(l, 2) = (3, 3)y 
U(l, 1) = (1, 3), entonces U = T. Esto se deduce del corolario y del he- 
cho de que {(1, 2), (1, 1)} es una base para R 2 . 

EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. De aquí en 
adelante, V y W son espacios vectoriales dimensionalmente finitos (sobre 
F) y T es una función de V en W. 

(a) Si T es lineal, entonces T conserva las sumas y productos por escala- 
lares. 

(b) Si T(x -f y) = T(jc) -f T(y) entonces T es lineal. 
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(c) T es uno- a-uno si y sólo si N(T) = {0}. 

(d) Todas las proyecciones deben ser lineales. 

(e) Si T es lineal, entonces T(0 V ) = 0 W - 

(f) Si T es lineal, entonces nulidad(T) + rango(T) = dim(W). 

(g) Si T es lineal, entonces lleva subconjuntos linealmente independien- 

tes de V a subconjuntos linealmente independientes de W. 

(h) Si T, U: V-> W son lineales y concuerdan en una base de V, enton- 

ces T = U. 

(i) Dados x u x 2 £V y y u y 2 ÇW, existe una transformación lineal 
T: V—>W tal que T(Xi) = yi y T(x 2 ) = y 2 . 

Para los ejercicios 2 a 6, demostrar que T es una transformación lineal y encontrar 
bases para N(T) y R(T). Luego, calcular la nulidad y el rango de T y verificar 
el Teorema 2.3. Finalmente, emplear los teoremas adecuados de esta sección para 
determinar si T es uno-a-uno o sobreyectiva. 


2. T: R 3 —> R 2 ; T(a,, a 2 , a 3 ) = (a, — a 2 , 2a 3 ). 

3. T: R 2 —> R 3 ; T(a„ a 2 ) = (a, + a 2 , 0, 2a, - a 2 ). 

4. T: £ £) = 

5. T: P 2 (fî) -> P 3 (R); T(/(x)) = xf(x) + f'(x). 

6 . T: M nxn —> F; T (A) = tr(.4). Recuérdese que 

tr(/4) = 2 An- 

i = i 


+ 2 a 12 \ 
0 ) 


7. Verificar los enunciados 1, 2 y 3 de la página 64. 

8 . Verificar que las transformaciones definidas en los Ejemplos 5, 6 y 7 son 
lineales. 


9. Para las siguientes T: R 2 —> R 2 , decir por qué T no es lineal. 

(a) T(a„ a 2 ) = (1, a 2 ) 

(b) T(a„ a 2 ) = (a„ a,) 

(c) T(a„ a 2 ) = (sen a„ 0) 

(d) T(a„ Oi) = (|a,|, a 2 ) 

(e) T(a„ a 2 ) = (a, + 1, a 2 ) 

10. Supóngase que T: R 2 —> R 2 es lineal y que T(l, 0) = (1, 4) y 1(1, 1) — 
(2, 5). ï,Qué es T(2, 3)? <,T es uno-a-uno? 

11. Demostrar que existe una transformación lineal T: R 2 —> R' tal que T( 1, 1) 
= (1, 0, 2) y T(2, 3) = (1, -1, 4). iQ ué es T(8, 11)? 
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12. ^Existe una transformación lineal T: R 1 —> R- tal que T(l, 0, 3) = (1, 1) 
y T( —2, 0, -6) = (2, 1)? 

13. Demostrar el Teorema 2.6 y su corolario. 

14. Supóngase que T es una proyección en un subespacio W de un espacio vec- 
torial V. Demostrar que W = {xÇV: T(x) = x). 

15. Recordando la definición de P(R) dada en la Sección 1.2, defínase 

T: P(R)->P(R) y = JJfiDdt. 

Demostrar que T es uno-a-uno pero no sobreyectiva. 

16. Sean V y W espacios vectoriales dimensionalmente finitos y T: V—>W 
lineal. 

(a) Demostrar que si dim(V) < dim(W), entonces T no puede ser so- 
breyectiva. 

(b) Demostrar que si dim(V) > dim(W), entonces T no puede ser uno- 
a-uno. 


17. Dar un ejemplo de una transformación lineai T: R 2 —> R 2 tal que N(T) = 
R(T). 

18. Dar un ejemplo de transformaciones lineales diferentes T y U tales que 
N(T) = N(U) y R(T) = R(U). 

19. Sean V y W espacios vectoriales con subespacios Vj y W b respectivamente. 

Si T: V —»W es lineal, demostrar que T(V0 es un subespacio de W y 
(^ÇV: T(x) es un subespacio de V. 

20. Sea W un subespacio de un espacio vectorial dimensionalmente finito V. 
Demostrar que existe una proyección sobre W. 

21. Sean V y W espacios vectoriales y sea T: V-* W lineal. Sea {y u . . . , y k ) 
un subconjunto linealmente independiente de R(T). Si S — [x u . . . , x k } se 
selecciona de tal manera que J(x,) = y t para / U 1, . . . , k, demostrar que 
S es linealmente independiente. 

22. Sea T: Rlineal. Demostrar que existen escalares a, b y c tales que 
T U, y, z) = ax + by + cz para toda ( x , y, z) € R 2 . £ Se puede generalizar 
este resultado para T: F n —> F? Enunciar y demostrar un resultado semejan- 
te para T: F n —> F ni . 

23. Sea T: R 3 *—> R lineal. Describir geométricamente las posibilidades para el 
espacio nulo de T. Sugerencia: Usar el Ejercicio 22. 
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24. Sea V un espacio vectorial y sea T: V —» V lineal. Se dice que un subespa- 
cio W de V es T-invariante si T(jc) Ç W para toda x £ W, es decir, T(W) Ç W. 

(a) Demostrar que los subespacios {0}, V, R(T) y N(T) son todos T-in- 
variantes. 

(b) Si W es un subespacio T-invariante de V, defínase aT w : W> W 
mediante T w (x) = T(x) para toda W. Demostrar que T w es li- 
neal. 

(c) Si T es una proyección sobre W, demostrar que W es T-invariante y 
que T w = Iw- 

(d) Si V = R(T) 0W y W es T-invariante, demostrar que W Ç N(T). 
Demostrar también que si V es dimensionalmente finito, entonces 
W = N(T). 

(e) Demostrar que N(T W ) = N(T) n W y R(T W ) = T(W). 

25. Demostrar la siguiente generalización del Teorema 2.7 para espacios dimen- 
sionalmente infinitos: Sean V y W espacios vectoriales y sea J3 una base 
para V. Entonces para toda función f: f3-+\N existe únicamente una 
transformación lineal T: V —> W tal que T(jc) = f(x) para toda xÇ/3. 

26. Una función T: V —» W entre los espacios vectoriales V y W se llama aditi- 
va si T(x + y) = T(x) + T(y) para toda x, y€V. Demostrar que si V 
y W son espacios vectoriales sobre el campo de los números racionales, en- 
tonces cualquier función aditiva de V en W es una transformación lineal. 

27. Demostrar que existe una función aditiva T: R —> R (como se definió en 
el Ejercicio 26) que no es lineal. Sugerencia: Considérese a R como un 
espacio vectorial sobre el campo de los números racionales Q. Por el coro- 
lario del Teorema 1.15 este espacio vectorial tiene una base /3. Sean x y 
y elementos distintos de j3 y defínase /: /?—> R mediante f(x) = y, f(y) = * 
y f(z) = z en cualquier otro caso. Por el Ejercicio 26 existe una trans- 
formación lineal T: R R donde R se considera como un espacio vectorial 
sobre Q tal que T(z) = f(z) para toda z£f3. Entonces T es aditiva pero 
para c= y/x, T(cx) ^cT(x). 

2.2 REPRESENTACION MATRICIAL DE UNA 
TRANSFORMACION LINEAL 

Hasta ahora hemos estudiado las transformaciones lineales examinando sus 
rangos y sus espacios nulos. Ahora entraremos a uno de los procedimien- 
tos de mayor utilidad en el análisis de una transformación lineal sobre 
un espacio vectorial dimensionalmente finito; la representación de una 
transformación lineal mediante una matriz. De hecho, desarrollare- 
mos una correspondencia uno-a-uno entre matrices y transformaciones que 
nos permitirá utilizar las propiedades de una para estudiar las propiedades 
de la otra. 
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Necesitaremos primeramente del concepto de una “base ordenada” 
para un espacio vectorial. 

Definición. Sea V un espacio vecîorial dimensionalmente finito. Una base orde- 
nada para V es una base para V establecida con un orden especîfico; es 
decir, una base ordenada para V es una secuencia finita de elementos de V 
linealmente independientes que generen a V. 

Ejemplo 15. Sea V tal que tenga a J3 — [x ly x 2 , x A } como una base orde- 
nada. Entonces y = {x>, x u x A } es también una base ordenada, pero como 
bases ordenadas, p ^y. 

Para el espacio vectorial F n , llamaremos a {e u e 2 , ... , e n ) la base 
ordertada estándar para F n . 

Ahora que contamos con el concepto de base ordenada, seremos capa- 
ces de identificar vectores abstractos en un espacio vectorial de n dimen- 
siones con elementos n-dimensionales. Esta identificación será proporcio- 
nada mediante el uso de “vectores coordenados” tal como se introducen 
a continuación. 


Definición. Sea fi — {x u . . . , x n } una base ordenada para un espacio vecto- 
rial V dimensionalmente finito. Para x Ç V definimos al vector coorde- 
nado de x relativo a /?, denotado por [x]^, mediante 


[*h = 


/ a i\ 

\ a n/ 


donde 


n 

X = 2 aiXi. 

1=1 

Nótese que en la definición anterior [Xi]$ = e^. Se deja como ejercicio 
demostrar que la correspondencia x [x]p nos proporciona una transfor- 
mación lineal de V en F n . Estudiaremos esta transformación con más deta- 
lle en la Sección 2.4. 

Ejemplo 16. Sean V = P 2 (R) y fi — {1, x, x 2 }. Si f(x) = 4 + 6jc — lx 2 , 
entonces 



Procedamos ahora con la representación matricial prometida de una 
transformación lineal. Supongase que V y W son espacios vectoriales di- 


Representación matricial de una transformación lineal 77 

mensionalmente finitos con bases ordenadas j3 = { x u . . . , *„} y y = {y^, 

. .. , y m }, respectivamente. Sea T: V—>W lineal. Entonces existen esca- 
lares únicos Ç.F(i — 1, . . . , m y j = 1, . . . , n) tales que 

m 

T(*;) = 2 û» jy> para 1 < / < «. 

i =:1 

Definición. Utilizando la notaeión anterior, llamaremos a la matriz A de 
m x n, definida mediante A u = a,j, la matriz que representa a T en las 
bases ordenadas J3 y y y la escribiremos A = [T] ’. Si V = W y J3 = y, es- 
cribiremos A = [T]p. 

Nótese que la /'-ésima columna de A es sencillamente [T (x ;) ] Y . Obsér- 
vese igualmente que del corolario del Teorema 2.7 se concluye que si 
U: V->W es una transformación lineal tal que [U]} = [TJ’, entonces 
U = T. 

Ilustraremos el cálculo de [T]‘; en los siguientes ejemplos. 

Ejemplo 17. Defínase 

T: P.,(R)-+P 2 (K) mediante T (/)=/'. 

Sean J3 = (1, x, x 2 , x 5 } y y = {I, x, x 2 } bases ordenadas para PJR ) y 
P 2 (R), respectivamente. Entonces 

T(l) =01 + 0x + 0-^ 2 
T(;c) = l- l+ 0-x + 0-** 

TU 2 ) = 01 +2-x + 0-x 2 
TU 2 ) = 01 + 0jc + 3jc 2 

Y así se tendrá 

/0 1 0 0\ 
m> = (o 0 2 0 . 

\0 0 0 3/ 

Nótese que los coeficientes de T (jc' ) cuando se escriben como una combi- 
nación de elementos de y dan los elementos de la columna í-ésima. 

Ejemplo 18. Defínase 

T: R 2 -*• R 3 mediante Tfct!, a 2 ) = (a t + 3a 2 , 0, 2ai — 4a 2 ). 

Sean p y y las bases ordenadas estándar para R 2 y R 3 , respectivamente 
Ahora bien, 

T(l, 0) = (1, 0, 2) = 1 í>! + 0e 2 + 2e, 


y 


T(0, 1) = (3, 0, -4) = 3e! + 0e 2 - 4e 3 . 
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Por lo tanto, matricialmente, 



Si hacemos / = (e 3 , e 2 , e,}, entonces 


"’-l; 1) 

Ahora que hemos definido un procedimiento para asociar matrices con 
transformaciones lineales, veremos brevemente que esta asociación “con- 
serva” la adición. Para hacer más explícita esta situación, requeriremos de 
alguna discusión preliminar sobre la adición de transformaciones lineales. 

Definición. Sean T, U: V —> W funciones arbitrarias, donde V y W son espa- 
cios vectoriales , y sea aÇF. Definimos T + U: V —> W mediante (T + U) 
(x) = T(x) -f U(x) para toda xÇVyaT: V->W mediante (aT)(x) = 
aT(x) para toda x£V. 

Por supuesto, esta es la definición usual de la suma y de la multiplicación 
por escalares para las funciones. Afortunadamente, sin embargo, tenemos 
el resultado de que la suma de transformaciones lineales es lineal. 

Teorema 2.8 . Sean V y W espacios vecloriales y sean T. U: V —> W lineales. 
Entonces para toda aÇF 

(a) aT + U es lineal. 

(b) Utilizando las operaciones de suma y de multipíicación por 
escalares , como se definieron anteriormente, la coîección de to- 
das las transformaciones lineales de V en W, denotada por 
£(V, W), es un espacio vectorial sobre F. 

DEMOSTRACIÓN. 

(a) Sean x , yÇV y cÇ_F. Entonces 

(aT -f U) ( cx -f y) — aT(cx -f y) -f U(c* -f y) 

= a[cT(x) 4- T (y)] + d J(x) + U (y) 

= acT(x) + cU(jc) + aT(y) + U(y) 

= c[aT + UJU) i+ [aT + U ](y). 

Y tenemos que aT + U es lineal. 
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(b) Observando que T 0 , la transformación cero, juega el papel del 
elemento cero en £(V, W), es fácil demostrar que I(V, W) es 
un espacio vectorial sobre F. ■ 

En el caso donde V = W escribiremos I(V) en vez de £(V, V). 

En la sección siguiente veremos una identificación completa de £(V, 
W) con el espacio vectorial M mxn (F), donde n y m son las dimensiones 
de V y W, respectivamente. Esta identificación se establece fácilmente utili- 
zando el teorema siguiente. 

Teorema 2.9. Sean V y W espacios vecioriales dimensionalmeníe finiíos con 
bases ordenadas /3 y y, respeclivamente, y sean T, U: V —> W transforma- 
ciones lineales. Entonces 

(a) [T + U]; = [T]; + [U];. 

(b) [aT]J = a[T]; para toda a£F. 

demostración. Sea J3 = {x u . . . , x n ) y {y u . . . , y m }. Existen es- 
calares únicos a, } y b, } en F(1 < / < m, !</<«) tales que 

m m 

T(jf/) = 2 a;jy, y U(jr y -) = 2 para 1 < j < n. 

ì ~ 1 < - 1 

Por lo tanto 

m 

(T + U)(xj) = 2 (a„ + b„)y,. 

i - 1 

Y entonces 

([T + ujp ij — au = ([T]; + [u];)„. 

Así queda demostrado (a) y la demostración de (b) es semejante. ■ 

Ejemplo 19. Defínase 

T: R 2 -» R :î mediante T (a u a 2 ) = (a x + 3 a 2y 0, 2a u - 4 a,) 

y 

U: R 2 R 3 mediante Uí^, a,) = (a, - a ,, 2a u 3 a x + 2 a 2 ). 

Sean /3 y y, respectivamente, bases ordenadas estándar de R- y R 3 . En- 
tonces 
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(tal como se calculó en el Ejemplo 18) y 


m =|2 

Si calculamos ahora T + U utilizando las definiciones anteriores, obte- 
nemos 

(T + U)(ai, a>) = (2 a x + 2a >, 2 a u 5a x — la 2 ). 

Entonces 

[T + | 

que es sencillamente [T]^ + [U]^ lo que verifica al Teorema 2.9. 



EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Para lo 
siguiente, V y W serán espacios vectoriales dimensionalmente finitos con 
bases ordenadas j3 y y, respectivamente. Suponer que T, U: V—»W son 
lineales. 

(a) Para cualquier escalar a, aT + U es una transformación lineal de 
V en W. 

(b) [T]J = [U]J implica que T = U. 

(c) Si m = dim(V) y n = dim(W), entonces [T]J es una matriz de 
m x n. 

(d) [T + U]; = [T]; + [U]J. 

(e) £(V, W) es un espacio vectorial. 

(f) £(V, W) = £(W, V). 

2. Sean (3 y y las bases ordenadas estándar para R n y R m , respectivamente. 
Para las siguientes transformaciones T: R n —» R m , calcular [T]j;. 

(a) T: R 2 —» R 3 definida mediante T (a u a^) = (2 a x — a 2 , 3 a x + 4 a 2 , a x ). 

(b) T: R 3 —» R 2 definida mediante T(«,, a 2 , a :ì ) = (2ai + 3 a 2 — a ò9 

«i + a »). 

(c) T: R 3 —» R definida mediante T (a u a 2 , a 3 ) = 2a^ + — 3a 3 . 

3. Sea T: R 2 —» R 3 definida como T(a 1? a 2 ) = (a r — a >, a^, 2a^ + a 2 ). Sea /3 
la base ordenada estándar para R 2 y y = {(1, 1,0), (0, 1, 1), (2, 2, 3)}. 
Calcular [T]J. Si « = {(1, 2), (2, 3)}, calcular [T];. 
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4. Defínase 


T: M 2x 2 (K) -* P 2 («) 
Sea 



Calcular [T]J. 


mediante 



b\ 
d ; 


= (a + b) + (2 d)x + bx*. 




y y = { 1 , a : 2 }. 


5. Para los siguientes incisos, sean 

*={(i SHÔ î).(ï S).(S ?)}■ 

B = {1, x, x}\ 

y 

r = {i)- 

(a) Definida T: hÁ 2x2 (F) ^ M 2x2 (F) mediante T(^) /4*, calcular [T]«. 

(b) Definida 

T: P 2 (R) M 2x2 (fl) mediante T(/) = ^^ /^(3^)) 

donde ' significa diferenciación, calcular [T]“. 

(c) Definida T: M 2x2 (F) -* F mediante J(A) = tr(^4), calcular [T]^. 

(d) Definida T: P 2 (R) ^ R mediante T(/) = /(2), calcular [T]J. 

(e) Si 



calcular [A] a . 

(f) Si f(x) = 3 — 6x + x 2 , calcular [/]p. 

(g) Si aÇ_F y calcular [a\ r 


6 . Demostrar el inciso (b) del Teorema 2.9. 


7. * Sea V un espacio vectorial n-dimensional con una base ordenada fi. Defi- 

niendo a T: V —> F n mediante T(jc) = [jt]p, demostrar que T es lineal. 

8 . Sea V el espacio vectorial de los números complejos sobre el campo R. Si 
T: V —> V queda definida mediante T(z) — z donde I es el complejo con- 
jugado de z, demostrar que T es lineal y calcular [T]p, donde fì = {1, /}. 
Mostrar que T no es lineal si V se considera como un espacio vectorial 
sobre el campo C. 
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9. Sea V un espacio vectorial con la base ordenada fi = {x u ... , x„}. Defí- 
nase a x„ = 0. De acuerdo con el Teorema 2.7 debe existir una transforma- 
ción lineal T: V —> V definida mediante T (x } ) = x : , T para j = 1, . . . , 
rc. Calcular [T]p. 

10. Sea V un espacio vectorial n-dimensional y sea T: VV una transforma- 
ción lineal. Supóngase que W es un subespacio T-invariante de V (ver el 
Ejercicio 24 de la Sección 2.1) de dimensión k. Demostrar que existe una 
base fi para V tal que [T]^ tiene la forma 

1“ A B~ 

L o cỳ 

donde A es una matriz de k x k y O es una matriz cero de (n — k) x k. 

11. Sea V un espacio vectorial de dimensión finita y sea T una proyección sobre 
un subespacio W de V. Escoger una base ordenada adecuada fi para V 
tal que [T]p sea qna matriz diagonal. 

12. Sean V y W espacios vectoriaìes y sean T y U transformaciones lineales no 
nulas de V en W. Si R(T) D R(U) = { 0 ), demostrar que (T, U) es un sub- 
conjunto de £(V, W) linealmente independiente. 

13. Sea V = P (R), y para j > 0 defínase a T,: V —> V mediante T,(/) = f (j \ 
donde / ( /) sea la j-é sima derivada de /. Para cualquier entero positivo n 9 
demostrar que {T lt T„ . . . , T w ) es un subconjunto de £(V) linealmente 
independiente. 

14. Sean V y W espacios vectoriales y sea S subconjunto de V. Defínase S () ! = 
{T ££(V, W): T(jc) = 0 para toda xÇ5). Demostrar 

(a) 5° es un subespacio de £(V, W). 

(b) Si Sx y S> son subconjuntos de V y 5, Ç S>, entonces S ú t C S {) . 

(c) Si V, y V, son subespacios de V, entonces (V, T V 2 )" = V ( ’ n V { ; . 

15. Sean V y W espacios vectoriales dimensionalmente finitos y sea T: V —► W 
lineal. Supóngase que dim(V) = dim(W). Encontrar bases ordenadas fi 
y y para V y W, respectivamente, tales que [T]J sea una matriz diagonal. 

2.3 COMPOSICION DE TRANSFORMACIONES LINEALES 
Y MULTIPLICACION DE MATRICES 

En la Sección 2.2 aprendimos cómo asociar una matriz con un transfor- 
mación lineal de tal modo que las sumas de matrices quedaban asociadas 
con las correspondientes sumas de transformaciones. Ahora surge la pre- 
gunta sobre cómo se relaciona la representación matricial de una compo- 
sición de transformaciones lineales con las representaciones matriciales de 
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cada una de las transformaciones lineales asociadas. E1 intento de res- 
ponder a esta interrogante nos conducirá a una definición de multiplicación 
de matrices. Utilizaremos la notación UT para la composición de las trans- 
formaciones lineales U y T, contrastando con g o f para funciones arbitrarias 
g y /. Específicamente, tenemos la definición siguiente. 

Definición, Sean V, W y Z espacios vectoriales y sean T: V—>WyU: W~>Z 
lineales. Definamos UT: V -> Z mediante (UT)(x) — U(T(x)) para toda 
xÇV. 

Nuestro primer resultado muestra que la composición de transforma- 
ciones lineales es lineal. 

Teorema 2.10. Sean V, W y Z espacios vectoriales y T: V->WyU: W Z 
lineates. Entonces UT: V —> Z es lineal. 

demostración. Seai/ x, y£V y a£F. Entonces 

UT (ax + y) = U^T (ax + y)) = U(ûT(jc) + T (y)) 

= ûU(T(jc)) + U(T(y)) - û(UT)(jc) + UT(y). ■ 

E1 siguiente teorema enuncia algunas de las propiedades de la compo- 
sición de transformaciones lineales. 

Teorema 2.11. Sea V un espacio vectorial. Sean T, U,, U 2 ££(V). Entonces 

(a) T(U, + U 2 ) = TU, + TU 2 y (U, + U 2 )T = U,T + U 2 T. 

(b) T(U,U 2 ) - (TU,)U 2 . 

(c) Tl = IT = T. 

(d) a(UiU 2 ) = (aU,)(U 2 = U,(aU 2 ) para toda a£F. 
de mostración . Ejercicio. 

Estamos ahora en posición de definir el producto AB de dos matrices 
A y B. Por el Teorema 2.9, parece razonable requerir por analogía que 
si A = [U ]] y B = [T]J, donde T: V->Wy U: W ^ Z, entonces AB = 
[UT]; r . 

Ahora sean T, U, A y B como anteriormente y sean « = {x t , . . . , *„}> 
P = {y u • • • , ym) y y = {z„ • • • , Z/J bases ordenadas para V, W y Z, 
respectivamente. Para 1 < j < n tendremos 

/ m \ m 

(UT)(JC;) - U(T(JC;)) = U ( =24UW 

\fc-t / /c-i 

/ /> \ P / *«- \ 

= 2B„(2^* Z ,j=2 (2/l»B w )z, 

/v 1 \ i 1 / / 1 \ /c 1 / 

P 

= 2C iíZi . 
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donde 

CiJ — 2 AyliBhj. 

k = i 

Este cálculo sugiere la siguiente definición de multiplicación de ma- 
trices. 

Definición. Sean A una maîriz de m x n y B una matriz de n x p. Definimos 
el producto de A por B, denotado por AB, como la matriz de m x p tal 
que 

n 

(AB)ìj = 2 AiicB^j para 1 < i < m, 1 < j < p. 

k= i 

Nótese que (AB)jj es la suma de los producfos de los elementos co- 
rrespondientes al /-ésimo renglón de A y a la /’-ésima columna de B. 

A1 final de esta sección el lector verá algunas aplicaciones interesan- 
tes de esta definición. \ 

E1 lector debe observar que para que el producto AB quede definido, 
existen restricciones en cuanto a las dimensiones relativas de A y B. E1 
siguiente dispositivo simbolico puede ser útil: “(m x n) • (n x p) — 
(m x p)”; esto es, para que el producto AB esté definido, las dos dimen- 
siones “interiores” deben ser iguales y las dos dimensiones “exteriores” 
dan el tamano del producto. 

Ejemplo 20. 

Nótese de nuevo la relación simbólica (2 x 3) • (3 x 1) - 2 x 1. 

Como en el caso de la composición de funciones, tenemos que el pro- 
ducto de matrices no es conmutativo. Considérese los dos productos si- 
guientes. 



Ek>nde vemos que aun cuando ambos productos matriciales AB y BA están 
definidos, no es necesariamente cierto que AB = BA. 

Recordando la definición de transpuesta de una matriz dada en la 
Sección 1.3, demostraremos que si A es una matriz de m x n y B es una 
matriz de n x p, entonces ( AB) l = B^A 1 . Como 

(AB)\. = (AB)j t = 2 AjjçBjcj 

k= 1 
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y 

(B'A')ìj = 2 = 2 Bk,Aj ky 

k =ì k- ì 

ya queda demostrado. Por lo tanto, la transpuesta de un producto es igual 
al producto de las transpuestas, cambìando el orden de las matrices que 
se multiplican. 

E1 teorema siguiente es una consecuencia inmediata de nuestra defini- 
ción del producto de matrices. 


Teorema 2.12. Sean V, W y Z espacios vectoriales dimensionalmente finitos con 
bases ordenadas a, J3 y y, respectivamente. Sean T: V—>WyU: W ^-> Z 
transformaciones lineales. Entonces i 

[UTi: - [U]j/t]; . 

Corolario. Sea V un espacio vectorial dimensionalmente finito con una base 
ordenada (3. Sean T, UÇ£(V). Entonces [UT]^ = [U]^[T]^. 

Uustraremos lo anterior con el siguiente ejemplo. 


Ejemplo 21. Defínase 


U: P a (R) -> P 2 (/?) mediante U(/) = f 
como en el Ejemplo 17. Defínase 

T: P ,(K)-»P:,(K) mediante J(f)(x) = 

Sean a = {1, x, x 2 , jc 3 } y /? = {1, x, jc 2 }. Se tiene claramente que UT = I. 
Para ilustrar el Teorema 2.12, obsérvese que 


[UT], = [UTO = 


/0 1 0 0 \ 
(0 0 2 0 
\0 0 0 3/ 


0 0\ 
1 0 0 
0 i 0 
\o 0 \) 



La matriz diagonal de 3 x 3 anterior se Ilama “matriz identidad” y 
se define a continuación junto con una notación de gran utilidad, la “delta 
de Kronecker”. 


Definiciones. Definimos la delta de Kronecker 8,, mediante 8^ = 1 si i j y 
8 U = 0 si i j, y la matriz identidad de n x n, I,„ mediante (!„),, = 8,j. 

Así 
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Veremos en el teorema siguiente que la matriz identidad actúa como 
un elemento unitario en M inx n (F). Cuando el contexto sea lo suficiente- 
mente claro, omitiremos algunas veces el subíndice n de /„. 

Teorema 2.13. Para cualquier matriz A de n x n tenemos que I U A = AI„ = A, 
además, si V es un espacio vectorial dimensionalmente finito de dimensión 
n con una base ordenada /3, entonces [lv]/3 — ïn- 

DEMOSTRACIÓN. 

= 2 Un)ikA kj = 2 9i*Av = A\j. 

k-i k=i 

Por lo tanto, l n A — A. De la misma manera AI n = 

Entonces, para cada j tenemos 

n 

IV (•*; ) — Xj 2 9\jX\. 

i = l 

Por lo tanto [ly]^ = / w . ■ 

Para cualquier matriz A de n x n definiremos A- — AA, A 7, — A A 
y en general A k = A*-'A para k = 2, 3, . . . Definiremos A n = I n . 

Con esta notación vemos que si 



entonces A 2 = O (la matriz nula) aun cuando A^O, y vernos que la 
propiedad de eliminación (cancelación) para campos no es válida para 
las matrices. E1 siguiente teorema muestra, sin embargo, que la multipli- 
cación de matrices es distributiva res{>ecto a la suma. 

Teorema 2.14. Sea A una matriz de m x n y sean B y C matrices de n x P- 
Entonces 

A(B + C) = AB + AC, 
y para cualquier escalar a 

a(AB) - (aA)B - A(aB). 

DEMOSTRACIÓN. 

[A(B + C)]\j - 2 A AB + Chj = 2 A\ k (B kj + C k} ) 

k-l *=* 

= 2 (A ik B ki + A ,k.Ckj) = 2 A rk B k j + 2 A , k C ki 

k i 1 

= (AB)u + (AC)tj = [AB + AC] ik . 

E1 resto de la demostración se deja como ejercicio. ■ 


Sea /3 = {*„ 
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Corolario. Sea A una matriz de m x n, y sean B,, ... , B^ matrices de n x p 
7 ai, . .. , a* £F. Entonces 


DEMOSTRACIÓN. 



- ÌatABi. 


i = i 


Ejercicio. 


Si A es una matriz UV f i f /\ fly 
donde A> es la columna /-ésima 


• ,A*), 


l^u\ 

A 2 j 




de la matriz A. 

Para el teorema siguiente, e, representa la /-ésima columna de I 


Teorema 2.15. Sea A una matríz de m x n >> B una matríz de n x p. En- 
tonces 

(a) (AB) j = AB j . 

(b) B j = Bej. 

DEMOSTRACIÓN. 



l(AB) J 


AikBkj \ 


(M 

(AB)> = 

! . 

= 

• 

= A 

! • 


j 

\(AB)J 


i 2 ^ mhEjcj 


\Bj 


= AB>. 


Por lo tanto, (a) queda demostrado. La demostración de (b) se deja 
como ejercicio. ■ 

E1 resultado siguiente justificará mucho de nuestro trabajo anterior; 
utilizará la representación matricial de una transformación lineal y el 
producto de matrices para evaluar la transformación en cualquier vector 
dado. 

Teorema 2.16. Sean V y W espacios vectoríales dimensionalmente finitos que 
tienen bases ordenadas fì y y, respectivamente, y sea T: V W una trans- 
formación lineal. Entonces, para toda x £ V tenemos 

[T(*)Jr = [T]^[x](î. 
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demostración. Sea j 3 — {*!, . . . , *„} y sea A — [T]£. Como 

[ï (£«/*/)] = [Ì«/T(xì)] =2«, [T(jci)] t 

por el Ejercicio 7 de la Sección 2.2, según el corolario del Teorema 2.14 
es suficiente demostrar el teorema para x = jc ,(1 < / < n). Pero esto se 
sigue de la definición de A y del Teorema 2.15 puesto que 

[T (Xj)]y m = Aej = Alxjìp = [T TJLxjfo ■ 

Ejemplo 22. Sea T: P<(/?) —> Pj(/?) definida mediante T /) — /', y sean 
y? — {1, x, x 2 , jc a } y y — {1, x, x 2 } bases ordenadas para ?\(R) y P>(R)s 
respectivamente. Si A = [T]J, entonces tenemos del Ejemplo 17 que 

/0 1 0 0\ 

A= 0 0 2 0. 

\0 0 0 3/ 


Ilustraremos el Teorema 2.16 verificando que [T(p) ] r — [T ]][p]p don- 
de p£P H (R) es el polinomio p(x) — 2 — 4x 4- Jt 2 + 3 jc 3 . Sea q = T (p); 
entonces q(x) — p'(x) = —4 + 2jc + 9jc 2 . Por lo tanto 

/” 4 

ITW1, =M, = I 2 

Pero también 

/0 1 0 0\ 

m» = ^= 0 0 2 0 

\0 0 0 3/ 



Completaremos esta sección con la introducción de la “transformación 
de multiplicación por la izquierda” L.,, donde es una matriz de m x n. 
Esta transformación es probablemente la herramienta más importante para 
transferir propiedades sobre transformaciones a propiedades semejantes 
sobre matrices y viceversa. Por ejemplo, la utilizaremos para demostrar 
que el producto de matrices es asociativo. 

Definìción. Sea A una matriz de m x n con elementos de un campo F. Deno- 
tamos por L A al mapeo L A : F"F 1 " definido por L A (x) = Ax (el produc- 
to matricial de A por x) para cada vector columna xÇF". Llamamos a L A 
una transformación de multiplicación por la izquierda. 
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Ejemplo 23. Sea 


Si 


■dî 



entonces 




Veremos en el teorema que sigue que l A no únicamente es lineal, sino, 
de hecho, tiene otras muchas propiedades de gran utilidad. Estas propie- 
dades son todas muy naturales y por lo tanto son fáciles de recordar. 

Teorema 2.17. Sea A una maîriz de m x n con elementos de F. Entonces la 
transformación La: F 11 F m es lineal. Además, si B es cualquiera otra 
matriz de m x n (con elementos de F), tenemos las siguientes propie- 
dades. 

(a) [Uî — A, donde B y y son las bases ordenadas estándar para 
F'i y F ni , respectivamente. 

(b) L a = L b si y sólo si A — B. 

(c) L.a +b = La + Lb y Ua = aL A para toda a ÇF. 

(d) Si T: F n —> F ni es iineal, entonces existe una matriz única C de 
m x n tal que T = U> 

(e) Si E es una matriz de n X p, entonces Lae — L A L E . 

(f) Si m = n, entonces Ii tl = l F n . 


demostración . E1 hecho de que L A sea lineal se deriva directamente del 
Teorema 2.14 y su corolario. 

(a) Lacolumna y-ésima de [L^ es igual a L A (Cj). Pero L A (ej) — 
Aej = A\ y entonces [l A ]l - A. 

(b) Si l A = L H entonces podemos utilizar (a) para escribir A = [i A ]] 
— [L;dJ = B. Por lo tanto A = B. La prueba de la proposición 
recíproca es trivial. 

La demostración de (c) le corresponde al lector. 

(d) Sea C = [T]J. En virtud del Teorema 2.16 tenemos que [T (x)] y = 
[T];[jc]p, o bienT(jc) = Cx = l c {x) para toda x. Entonces T = L c . 
La unicidad de C se deduce de (b). 
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(e) Para cualquier j tenemos L AK (ej) = (AE)e } — (AE) j = AE j = 
A(Eej) = Lj(E^) - L 4 (L K (e ; )) = (L.iL^) (e>). De donde L, tJÍ = 
LjL,; por el Teorema 2.7. 

La demostración de (f) le corresponde al lector. ■ 

Utilizaremos este tipo de transformaciones para establecer una impor- 
tante propiedad sobre matrices. / 

Teorema 2.18. Sean A, B y C maírices tales que A(BC) está definido. Enton- 
ces (AB)C queda definido y A(BC) = (AB)C; esto significa que el pro- 
ducto de matrices es asociativo. 

demostración. Se deja al lector demostrar que (AB)C está definido. 
Utilizando el inciso (e) del Teorema 2.17 y la asociatividad de una compo- 
sición de funciones, tenemos 

\-a(bo = \-a\-bc ~ Lj ( LjyL c ) — ( L ^ L ^) L C = L ^ fl L c — L (abìc* 

Así, del inciso (b) del Teorema 2.17 tenemos A(BC) — (AB)C. ■ 

Es innecesario decir que este teorema podría demostrarse directamente 
a partir de la definición det producto matricial. La demostración anterior, 
sin embargo, proporciona un prototipo de muchos otros argumentos que 
utilizan las relaciones entre transformaciones lineales y matrices. 

Una aplicación 

Una grande y variada colección de aplicaciones interesantes surge en rela- 
ción con unas matrices especiales llamadas “matrices incidentes'’. Una 
matriz incidente es una matriz cuadrada en donde todos los elementos 
son ceros o unos y, por conveniencia, todos los elementos de la diagonal 
principal son cero. Si tenemos una cierta relación entre un grupo de n 
objetos que denotaremos por 1, 2, . . . , n, entonces definimos la matriz 
de incidencia asociada A mediante: A }} — 1 si / está relacionado con j 
y Ajj = 0 en cualquier otro caso. 

Para hacer las cosas concretas, supongamos que tenemos cuatro per- 
sonas, cada una de las cuales posee un dispositivo de comunicación. Si la 
relación entre este grupo es “puede transmitir a”, entonces A, } = 1 si i 
puede mandar un mensaje a / y A }j — 0 en cualquier otro caso. Supón- 
gase que 

/0100 
10 0 1 

A = 

0 10 1 
\l 1 0 0 
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Entonces como A :u = 1 y A ì4 = 0 vemos que la persona 3 puede trans- 
mitir a 4 pero 1 no puede transmitir a 4. 

Obtendremos una interpretación interesante de los elementos de A 2 . 
Considérese por ejemplo, 

(A 2 ) :u — A :U A ii 4 - A :i ,A >, -h A :u A :u + A :U A 1 . 

Nótese que cualquiera de los términos A :ik A kl será igual a 4 si y sólo si 
Am y Aia son iguales a 1 esto es, si y sólo si 3 puede transmitir a k y k 
puede transmitir a 1. Así (A 2 ) :u da el número de maneras en las que 
3 puede transmitir a 1 en dos eîapas (o en un relevo). Como 


/1 


\1 


0 0 1\ 

2 0 0 

1 0 1 

1 0 I/ 


vemos que 3 puede transmitir a 1 de dos maneras con un relevo. En ge- 
neral (A + A 2 + ... + A") i} es el número de maneras en las que i 
puede transmitir a / en un máximo de n etapas. 

Una coleccÌQn máxima de tres o más personas con la propiedad de que 
cualquier par de ellas transmita recíprocamente de una a otra se llama 
una cliqué. E1 problema de la determinación de las cliqués parece a prime- 
ra vista demasiado difícil. Sin embargo, si se define una nueva matriz B 
por Bj, ~ 1 si i y j pueden transmitirse de una a otra y de lo contrario 
B,j — 0, entonces puede mostrarse (ver Ejercicio 16) que la persona i 
pertenece a una cliqué si y sólo si (B :i )u > 0. Por ejemplo, supóngase 
que la matriz de incidencia asociada con alguna relación es 

/0 1 0 1 \ 

10 10 
A ~ 1 1 0 1 

\1 1 1 0 / 

Para determinar qué personas pertenecen a las cliqués, formamos una ma- 
triz B como la anterior y calculamos B\ En este caso 



1 

0 



/0 

4 

0 

4 \ 

1 

0 

1 

o' 

y B 3 = 

4 

0 

4 

0 

0 

1 

0 

1 , 


0 

4 

0 

4 


0 

1 

o) 


\4 

0 

4 

0/ 


Como todos los elementos de la diagonal de B son ceros, concluimos 
que no hay cliqués en esta relación. 

Nuestro ejemplo final acerca del uso de matrices de incidencia se rela- 
ciona con el concepto de dominancia. Una relación entre un grupo de 
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t 


personas se llama relación de dominancia si la matriz de incidencia aso- 
ciada A tiene la propiedad de que A u = 1 si y sólo si Aù — 0 para 
toda i y toda /, esto es, dadas dos personas cualesquiera, èxactamente 
una de ellas domina (o, utilizando la terminología de nuestro primer ejem- 
plo, puede transmitir un mensaje) a la otra. Para tal relaçión, puede 
demostrarse (ver Ejercicio 18) que la matriz A 4- A 2 tiene un renglón 
(columna) que contiene elementos positivos en todas las posiciones excepto 
en la diagonal principal. En otras palabras, existe al menos una persona 
que domina a (es dominada por) todas las demás en una o dos etapas. 
De hecho, puede demostrarse que cualquier persona que domina a (es 
dominada por) el mayor número de personas en la primera etapa cumple 
con esta propiedad. Considérese, por ejemplo, a la matriz 


A = 


dominancia. Ahora bien, 


(0 

i 

0 

i 

°\ 


0 

0 

1 

0 

0! 


1 

0 

0 

1 

0 


0 

1 

0 

0 

»1 


\1 

1 

1 

0 

0 1 


esta 

matriz 

corresponde 


/0 

2 

1 

1 




1 

0 

1 

1 

ol 


= 

1 

2 

0 

2 

ì 



1 

2 

2 

0 

i| 



\2 

2 

2 

2 

01 



Entonces, las personas 1, 3, 4 y 5 dominan a (pueden mandar mensa- 
jes a) todas las demás en a lo más dos etapas, mientras que las personas 
1, 2, 3 y 4 son dominadas por (pueden recibir mensajes de) todas las 
demás en a lo más dos etapas. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Para lo que 
sigue, V, W y Z son espacios vectoriales con bases ordenadas (finitas) 
p y y, respecti vamente; T: V-+WyU: W-^Z son ambas lineales; 
y A y B son matrices 

(a) [UT-E - [U];[T];. 

(b) [T(x)]|3 = [T]f[x]« para toda JtÇV. 

(c) [U(y)]/3 = [U]f[y] p para toda y€W. 

(d) [l v ]« - /. 

(e) [PK= ([T X)*. 
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(f) A 2 — I implica que A — l o bien |Ì4 = —I. 

(g) T = l A para alguna matriz A. 

(h) A 2 — O implica que A — O donde O denota la matriz nula. 

(i) L. 1+/1 ~ ki T- L jì. 

(j) Si A es cuadrada y A,j = para toda / y /, entonces A — I. 


2 . Sean 


-G -])■ *=(i î 
c =(-! -i í)- y 


Calcular A(2B + 3C), (/1B)D y /1 (BD). 


3 . Sea g(jc) = 3 + x. Defínase 

T: P,(K)-+P,,(K) para T(/) = f'g + 2f. 


U: P,(/î) —> R 3 para U(a + + cjc 2 ) = (a + b, c, a — b). 

Sean B = {1, jc, jc 2 } y y — [e t , e 2 , e 

(a) Calcular directamente [U]}, [T]p y [UT] 2 . Luego, utilizar el Teorema 
2.12 para verificar el resultado. 

(b) Sea h(x) = 3 - 2x + x 2 . Calcular [h]^ y [U(/j)] r . Luego, emplear 
[U]} de (a) y utilizar el Teorema 2.16 para verificar el resultado. 

4. Para cada uno de los incisos siguientes, sea T la transformación lineal defi- 
nida en el inciso correspondiente del Ejercicio 5 de la Sección 2.2. Utilizar 
el Teorema 2.16 para calcular: 

(a) [T(/ 1 )]«, donde A = ( J 

(b) [T(/)]«, donde f(x) = 4 - 6* + 3jc 2 . 

(c) [T(/l)]y, donde A = Q 4 )- 

(d) [T(/)] y , donde f(x) = 6 — x + 2x-. 

5. Completar la demostración del Teorema 2.14 y su corolario. 

6 . Demostrar el inciso (b) del Teorema 2.15. 

7. Demostrar el Teorema 2.11. 

8 . Encontrar transformaciones lineales U, T: F 2 —> F 2 tales que UT = T 0 (la 
transformación nula) pero TU =£ T 0 . Utilice su respuesta para encontrar ma- 
trices A y B tales que AB — O pero BA =£ O. 
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9. Sea A una matriz de m x n. Demostrar que A es una matri^ diagonal si 
y sólo si A ìj = SijAji para toda i y toda /. 

10. Sea V un espacio vectorial y sea T: V=> V lineal. Demostrar que T 2 = T 0 
si y sólo si R(T) C N(T). 

11. Sean V, W y Z espacios vectoriales, y sean T: V—>WyU: W -> Z li- 
neales. 

(a) Si UT es uno-a-uno, demostrar que T es uno-a-uno. ^También U debe 
ser uno-a-uno? 

(b) Si UT es sobreyectiva, demostrar que U también lo es. ^También T 
debe ser sobreyectiva? 

(c) Si U y T son uno-a-uno y sobreyectivas demostrar que UT también 
lo es. 


12. Sean A y B matrices de n x n. Recordar que Ia traza de A , denotada por 
tr (A), es igual a 

n 

'ZAr, 

1 ~ 1 

Demostrar que tr (AB) = tr {BA) y tr (A) = tr(/í'). 

13. Sea V un espacio vectorial dimensionalmente finito y sea T: V -> V lineal. 

(a) Si rango(T) = rango^T 2 ), demostrar que R(T) n N(T) — {0}. De- 
ducir que V = R(T) ® N(T). 

(b) Demostrar que existe un entero positivo k tal que V — R(T*) ® N(T A ). 

14. * Sea V un espacio vectorial. Determinar todas las transformaciones lineales 

T: V V tales que T — T 2 . Sugerencia: Nótese que x = T(jc) + (x — 
T(*)) para toda x enV y demostrar que V = { y : T(y) = y } ® N(T). 

15. Utilizando únicamente la definición de multiplicación matricial, demostrar 
que la multiplicación de matrices es asociativa. 

16. Para una matriz de incidencia A con la matriz asociada B definida por: 

Bij — I, si / está relacionada con / y / está relacionada con /, y de lo con- 
trario B i} = 0, demostrar que / pertenece a una cliqué si y sólo si (B*) > 0. 

17. Utilizar el Ejercicio 16 para determinar las cliqués en las relaciones corres- 
pondientes a las siguientes matrices de incidencia. 


0 1 0 1 \ 
10 0 0 
0 10 1 
10 10 / 


0 0 1 1 \ 
10 0 1 
10 0 1 
10 10 / 




« 
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18. Sea A una matriz de incidencia asociada con una relación de dominancia. 
Demostrar que la matriz A -f A 2 tiene un renglón (columna) que contiene 
elementos positivos en todas las posiciones excepto en la diagonal prin- 
cipal. 

19. Demostrar que la siguiente matriz A corresponde a una relación de domi- 
nancia y utilizar el Ejercicio 18 para determinar cuál(es) persona(s) domi- 
na(n) a (son dominadas por) las demás en no más de dos etapas. 


(0 . 
, 4=00 
\l 0 



20. Sea A una matriz de incidencia de n x n que corresponde a una relación 
de dominancia. Determinar el número de elementos no nulos de A. 


2.4 INVERTIBILIDAD E ISOMORFISMOS 

E1 concepto de invertibilidad se introduce muy temprano en el estudio de 
las funciones. Por fortuna, muchas de las propiedades intrínsecas de las 
funciones son compartidas por sus inversas. Por ejemplo, en cursos de 
cálculo aprendimos que las propiedades de continuidad o de diferenciabi- 
lidad generalmente se conseryan para las funciones inversas. Veremos en 
esta sección (Teorema 2.19) que la inversa de una transformación lineal 
también es lineal. Este resultado nos ayudará de una manera importante 
en el estudio de las “inversas” de las matrices. Como era de esperarse de 
la Sección 2.3, la inversa de la transformación l A (cuando existe) puede 
utilizarse para determinar las propiedades de la inversa de la matriz A. 

En el resto de esta sección aplicaremos muchos de los resultados sobre 
invertibilidad al concepto de “isomorfismo”. Veremos que los espacios vec- 
toriales dimensionalmente finitos (sobre F) de dimensiones iguales pueden 
ser identificados. En breve, estas ideas serán expuestas con más precisión. 

Los conceptos sobre funciones inversas que se encuentran en el apén- 
dice B son, por supuesto, verdaderos para el caso de las transformaciones 
lineales. No obstante, repetiremos algunas de estas definiciones para em- 
plearlas en esta sección. 

Definición. Sean V y W espacios vectoriales y sea T: V -> W lineal. T tiene una 
inversa U: W—* V si TU Uf = l v . Como en el Apéndice B, las 

inversas son únicas y escribiremos U — T 1 . Decimos que T es invertible 
si T tiene una inversa. 

Las siguientes propiedades se cumplen para funciones invertibles T y U. 

1. (TU) _Î = U-^T' 1 . 

2. (T 1 )" 1 = T; en particular, T 1 es invertible. 
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Utilizaremos también el hecho de que una función es invertible si y sólo 
si es uno-a-uno y sobreyectiva. 

Ejemplo 24. Defínase T: P^R) -> R 2 mediante T (a + bx) = (a, a + 
b). E1 lector podrá verificar directamente que T 1 : R 2 =>P X (R) queda 
definida mediante T _1 (c, d) — c + (d — c)x. Obsérvese que T _1 , también es 
lineal. Como lo demuestra el Teorema 2.19, esto es cierto en general. 

Teorema 2.19 . Sean V y W espacios vectoriales, y sean T: V —» W lineales e 

invertibles, entonces T 1 : W => V es lineal. 

demostración. Sean y u y 2 ÇW y c£F. Como T es sobreyectiva y uno- 
a-uno, existen vectores únicos x x y jc 2 tales que T (jc^ ) = y x y T(jc 2 ) = y 2 . 
Entonces x x — T^(y,) y x 2 = T _1 (y 2 ), y así 

T _1 (cy, + y 2 ) = T-^cTíjc,) + T(jc 2 )] = T-*[T (cjc, + x,)] 

= cx y + jc 2 = cl-Hy,) + T '(y,). ■ 

E1 Teorema siguiente se sigue inmediatamente del Teorema 2.5. 

Teorema 2.20. Sean V y W espacios vectoriales dimensionalmente finitos de 

dimensiones iguales, y sea T££(V, W). Entonces las siguientes proposi- 
ciones son equivalentes. 

(a) T es invertible. 

(b) T es uno-a-uno. 

(c) T es sobreyectiva. 

Estamos ahora listos para definir la inversa de una matriz. E1 lector 
debería darse cuenta de la analogía con la inversa de una transformación 
lineal. 

Definición. Sea A una matriz de n x n. Entonces A es invertible si existe una 
matriz B de n x n tal que AB = BA = I. 

i 

La matriz B es única y se llama inversa de A y se escribe B = A 1 . 
(Si C fuera otra matriz, entonces C — C/ = C(AB) = ( CA)B = 1B = B. 

Ejemplo 25. E1 lector deberá verificar que la inversa de 

G I) - (-' - 5 7 )' 

En la Sección 3.2 aprenderemos una técnica para calcular la inversa 
de una matriz. Ahora nos gustaría desarrollar una serie de resultados que 
relacionan inversas de matrices con inversas de transformaciones lineales. 
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Teorema 2.21. Sean Vy W espacios vectoriales dimensionalmente finitos con 
bases ordenadas /3 y y, respectivamente. Sea T: V — »W lineal. Entonces 
T es invertible si y sólo si [TJ; es invertible. Además , [T ] ] $ — ( [ T]^ )' 1 . 

demostración. Supóngase que T es invertible. Como T es uno-a-uno, el 
Teorema 2.6 implica que T (J3) es un subconjunto independiente de W. 
Como T es sobreyectiva, el corolario del Teorema 2.^ implica que el sub- 
espacio generado por L(T(j3)) = R(T) - W. Entonces T (fi) es una base 
para W con dim(V) elementos. Por lo tanto, dim(V) = dim(W). Sea 
n = dim(V). Entonces [T]; es una matriz de n v n. Ahora bien, T l : 
W->V satisface TT 1 = l w y T 'T = l v . De donde, 

in = Hvb = [T-'Tip - [t 

Análogamente, [T]^[T -1 ]^ = /„, y por lo tanto ([T]^) 1 ~ [T _1 ]f. 

Ahora sea A = [T]'; invertible. Entonces existe una matriz B de 
n x n tal que AB = BA = /„. Defínase 

M 

U: W—>V mediante U(t/) 2 

î i 

donde y = {jc„_jc.} y j8 = {y„-y«). Entonces [U]Ji= B. De- 

mostraremos que U = T _1 . Obsérvese que por el Teorema 2.12 [UT]p = 
[U]f[T]J = BA = I„ = [lv]^. Así, UT = l v , y análogamente TU = l w - ■ 


Ejemplo 26. Para los espacios vectoriales P,(/?) y R 2 , selecciónese las 
bases /3 = { 1, jc) y y = {c,, e_.}, respectivamente. Con la notación del 
Ejemplo 24, tenemos que 


m; 


y [T ] Y 



Se puede verificar mediante el producto matricial que cada matriz es la 
inversa de la otra. 


Corolario 1. Sea V un espacio vectorial dimensionalmente finito con una base 
ordenada / 3 , v sea T: V V lineal. Entonces T c.s invertible si y sólo si 
[T lo es. Además , [T [T]. 1 . 

demostración. Ejercicio. 

Corofar/o 2. Sea A nna ma/riz n x n. Entonces A e\s invertible si y sólo si 
L a ^ invertibìe. Además (L A ) 1 = L A .. 

demostración. Ejercicio. 

La noción de invertibilidad se puede utilizar para formalizar lo que 
el lector ya debe haber observado, esto es, que ciertos pares de espacios 
vectoriales se parecen mucho entre sí, excepto por la forma de sus ele- 
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mentos. Por ejemplo, en e! caso de M. JxL ,(F) y Fsi asociamos a cada 
matriz 

c 

1a 4-dimensionaI (cuarteta) (a, b , c, í/), vemos que las sumas y los pro- 
ductos por escalares se asocian de una manera semejante; esto es, en 
términos de la estructura de espacios vectoriales, estos dos espacios vecto- 
riales pueden considerarse idénticos o “isomorfos". 

Definición. Sean V y W espacios vectoriales. Decimos que V es isomorfo a 
W si existe una transformación lineal T: V -> W que sea invertible. Taì 
transformación lineal se Ilama isomorfismo cie V en W. 

Dejamos como ejercicio la demostración del hecho de que “es isomor- 
fo a“ es una relación de equivalencia. 

Ejemplo 27. Defínase T: F- P,(F) mediante T(a„ a.) = a, + a>x. Es 
evidente que T es invertible; así F- es isomorfo a P,(F). 

Ejemplo 28. Defínase 

T: P:.(rt)->M„ S (/Î) mediante T(/) = jjjj 

Se puede verificar fácilmente que T es lineal. Mediante el uso de la ecua- 
ción de interpolación de Lagrange de la Sección 1.6 puede demostrarse 
(compárese con el Ejercicio 20) que T(/) = O solamente cuando / es el 
polinomio cero. Luego, T es uno-a-uno y por el Teorema 2.20 tenemos 
que T es invertible. Podemos concluir que P,(f?) es isomorfo a M 2x2 (f?). 

En cada uno de los dos ejemplos anteriores, el lector habrá observado 
que los espacios vectoriales isomorfos tienen dimensiones iguales. Como 
lo demuestra el teorema siguiente, esto no es ninguna coincidencia. 

Teo rema 2.22. Sean V y W espacios vecíoriales dimensionalmenie finitos (so- 
bre el mismo campo F). Entonces V es isomorfo a W si y sólo si dim(\f) 
■' dim( W). 

demostración. Supóngase que V es isomorfo a W y que T: V -> W es 
una transformación lineal uno-a-uno de V en W. Entonces como en la 
demostración del Teorema 2.21 tenemos que dim(V) = dim(W). 

Ahora supóngase que dim(V) = dim(W) y sean fS = {x,, . . . , *„} y 

y {v..y„} bases para V y W, respectivamente. Por el Teorema 2.7 

existe T: V —► W tal que T es lineal y J(x.) = y, para / = \, ... ,n. Utili- 
zando el corolario al Teorema 2.3, tenemos que R(T) = L(T(/3)) = L(y) 
W, por lo que T es sobreyectiva. Por el Teorema 2.5 tenemos que T 
también es uno-a-uno. ■ 
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Corolario . Si V es un espacio vectorial de dimensión n, enlonces V es isomor - 
fo a F n . 

Hasta ahora hemos asociado transformaciones con sus representaciones 
matriciales. Ahora estamos en posición de demostrar que, como espacio 
vectorial, la colección de todas las transformaciones entre dos espacios vec- 
toriales dados puede ser identificada con el espacio vectorial adecuado de 
matrices de m x n. 

Teorema 2.23. Sean V y W espacios vectoriales dimensionalmente finitos de 
dimensiones n y m, respectivamente, y sean ft y y bases ordenadas para 
V y W, respectivamente. Entonces la función <ï>: £(V, W)-»M myn (F), 
definida por í>(T) = [T] y fi para T Ç£(V, W) es un isomorfismo. 

demostración. E1 Teorema 2.9 nos permite concluir que 4> es lineal. 
Entonces debemos demostrar que í> es uno-a-uno y sobreyectiva. Sean 
fì = {*>. Xn} y y = {yu • * • , ym}- 

(a) Demostraremos primero que N(<ï>) = {T 0 }, donde T 0 es la trans- 
formación cero. Esto implicará que es uno-a-uno. Supóngase que <ï>(T) 
= O. Entonces para cada / tenemos T(jc y ) = 0y t + ... + 0y w = 0. Por 
el corolario del Teorema 2.7 tenemos que T = T 0 . 

(b) Ahora demostraremos que <ï> es sobreyectiva. Sea A una matriz 
de m x n- De acuerdo con el Teorema 2.7 existe T ££(V, W) tal que 

»/í 

T(jc y ) = 2 A u y; para 1 < < n. 

i 1 

Entonces [T]J -- A, y por lo tanto <I>(T) — A , es sobreyectiva. 

Corolario. Sean V y W espacios vectoriales dimensionalmente finitos de dimen - 
siones m y n, respectivamente. Entonces £(V, W) es dimensionalmente 
finito de dimensión mn. 

demostración. La demostración se sigue de los Teoremas 2.23 y 2.22, 
y del hecho de que dim(M lllxn (F)) = mn. ■ 

Concluiremos esta sección con un resultado que nos permitirá ver más 
claramente la relación entre transformaciones lineales definidas en espacios 
vectoriales abstractos dimensionalmente finitos y transformaciones linea- 
les definidas en F n . 

Principiaremos citando la transformación x [jc]^ discutida en la Sec- 
ción 2.2. 

Definición. Sea /3 una base ordenada para un espacio vectorial n-dimensional V 
sobre el campo F. La representación estándar de V con respecto a f3 
es la función </>^: V —> F" definida por </>^(x) = [x]p para toda x£V. 
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Ejemplo 29. Sea V - R 2 , fi = {(1, 0), (0, 1)}, y y = {(1, 2), (3, 4)}. 
Para jc = (1, —2) tenemos 

$p(x) = 0]|3 = (- 2 ) y = [•*]■)' ~ ( 2 )' 

Ya hemos observado antes que <j>p es una transformación lineal. E1 teo- 
rema siguiente nos dice mucho más. 

Teorema 2.24. Para cualquier espacio vecíorial V dimensionalmente finito con 
una base ordenada fi, <j> y es un isomorfismo. 

demostración. Ejercicio. 

Este teorema nos proporciona una prueba alternativa de que un espa- 
cio vectorial n-dimensional es isomorfo a F n (ver el corolario del Teore- 
ma 2 . 22 ). 

Estamos ahora listos para utilizar la representación estándar de un 
espacio vectorial junto con la representación matricial de una transforma- 
ción lineal para estudiar la relación entre la transformación lineal T: 
V —> W donde V y W son espacios vectoriales abstractos dimensionalmente 
finitos, y l A : F n —> F ni , donde A = [T]J y fi y 7 son bases ordenadas 
cualesquiera para V y W, respectivamente. 

Antes de enunciar el Teorema 2.25 consideraremos la figura 2.2. Nóte- 
se que existen dos composiciones de transformaciones lineales que mapea- 
rán a V en F m : 

1. Mapeo de V en F 11 con <j>$ y continúa esta transformación con L t ; 
esto nos dará la composición 

2. Mapeo de V en W con T, y continúa por <j> y para obtener la com- 
posición ,<t> y T. 

Estas dos composiciones están representadas por las flechas punteadas 
en el diagrama. E1 Teorema 2.25 establece que ambas composiciones dan 
el mismo resultado; esto es, que ambas composiciones son iguales. 


( 2 )\ 


0 ) 


F n ■ 


W 

F m 


figura 2.2 
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Heurísticamente, el teorema establece que después de que V y W hayan 
sido identificados con F n y F m a través de </>p y <j> y , respectivamente, pode- 
mos “identificar” a T con l A . 

Teorema 2.25. Sea T: V W una transjori wción lineal de un espacio vecto- 
rial n-dimensional V sobre F a un espacio vectorial m-dimensional W 
sobre F. Sean /3 y y bases ordenadas, respectivamente, para V y W, y sta 
A =[T]J. Entonces — <t> t T. 

demostración. E1 teorema es esencialmente una reformulación del Teo- 
rema 2.16, porque si entonces 

(L.I <l>e)(x) = La(<êp(*)) = La(Wp) = A[x]fl = [T]J 

= [T(jc)] y = 4,y( T(*)) = (4>yJ)(x). u 

Ejemplo 30. Recordemos la transformación T: P ; ,(R) — > P 2 (R) definida 
en el Ejemplo 17. (T(/) = /'.) Sean fì = {1, x, x 2 , x 1 } y y = {1, x, x 2 } 
bases ordenadas para P .,(/?) y P 2 (R), respectivamente, y sean 4>P : Pa(R) 
—> R 4 y 4> y : P 2 (R) -> R 3 representaciones estándar de P, (R ) y P 2 (R) con 
respecto a /? y y, respectivamente. Sea /1 = [T]}; entonces 

/0 1 0 0 \ 

,4=10 0 2 O). 

\0 0 0 3/ 

Para ilustrar el Teorema 2.25, considérese al polinomio p(x) = 2 + 
x — 3x 2 + 5x 3 . Demostraremos que L,i <j>p(p) = <j> y J(p). 

Tenemos 


/0 1 

\-A<f>fl(p) = 0 0 

\o 0 



/ 2 \ 
1 

-3 

5/ 



Pero como 


tenemos que 


T (p) = p' — 1 — 6x + 1 5jc 2 , 



Así, L A <t>[j(p) = <j> y T(p). 

Trátese de repetir este ejemplo con distintos polinomios p(x). 
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EJERCICIOS 

1 . Decir si las siguientes afirmaciones son verdaderas o falsas. Para lo siguien- 
te, V y W serán espacios vectoriales con bases ordenadas (finitas) « y /?, 
respectivamente, y T: V —> W será lineal. A y B serán matrices. 

(a) (["TD -1 - [T- 

(b) T es invertible si y sólo si T es uno-a-uno y sobreyectiva. 

(c) T = L t donde A = [T]J. 

(d) M^xsíF) es isomorfo a F\ 

(e) P„(F) es isomorfo a P m (F) si y sólo si aî — m. 

(f) = / implica que /1 y B son invertibles. 

(g) (A- 1 )- 1 = /f. 

(h) /4 es invertible si y sólo si L t es invertible. 

(i) /4 debe ser cuadrada para poder tener una inversa. 

2. * Sean A y B matrices invertibles de n x n. Demostrar que AB c s inver- 

tible y que (AB) 1 = B M 1 . 

3. * Sea /1 invertible. Demostrar que A l es invertible y (/4 f ) _1 = (A _1 ) e . 

4. Demostrar que si /4 es invertible y ,4£ = O, entonces B = (9. 

5. Si /4 2 = O, demostrar que >1 no puede ser invertible. 

6. Demostrar los Corolarios 1 y 2 del Teorema 2.21. 

7. Sean 4 y 5 matrices d e n x n tales que AB es invertible. Demostrar que A 
y B son invertibles. Demostrar que, en general, este resultado es falso si 
al menos una de las matrices no es cuadrada. 

8 . * Sean A y B matrices de n x n tales que AB — l n . Demostrar que A — B 1 

(y por lo tanto B = A- 1 ). (Decimos en efecto que para matrices cuadra- 
das una inversa unilateral es una inversa bilateral.) 

9. Demostrar que la transformación definida en el Ejemplo 28 es uno-a-uno. 

10. Demostrar el Teorema 2.24. 

11 . Sea ^ tal que signifique “es isomorfo a”. Demostrar que ^ es una rela- 
ción de equivalencia sobre la clase de espacios vectoriales sobre F tal como 
se define en el Apéndice A. 

12 . Sea 

V={(« - + /): 

Constrúyase un isomorfismo de V a F\ 
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13. Sean V y W espacios vectoriales dimensionalmente finitos y sea T: V-* W 
un isomorfismo. Si /3 es una base para V, demostrar que T(J3) es una base 
para W. 

14. Sea B una matriz invertible de n x n. Defínase $: M nxn (F) ->M nxn (F) 
por $(A) = B l AB. Demostrar que <ï> es un isomorfismo. 

15. Sean V y W espacios vectoriales dimensionalmente finitos y sea T: V —» W 
un isomorfismo. Sea V 0 un subespacio de V. 

(a) Demostrar que T(V 0 ) es un subespacio de W. 

(b) Demostrar que dim(V 0 ) — dim(T(V 0 )). 

16. Repetir el Ejempio 30 con el polinomio p(x) = 1 4- x + 2x 2 + 

17. Sea V = M 2 x2 (F) el espacio vectorial de cuatro dimensiones de las matri- 
ces de 2 x 2 con elementos reales. Recuérdese del Ejemplo 4 que el mapeo 
T: V—> V definido por T(A) = A f para toda A £V es una transformación 
lineal. 

(a) Sea /3 = (E 11 , E 12 , E 2 \ E 22 } donde E ij es la matriz de 2 x 2 que 
tiene el elemento /, j igual a uno y el resto de los elementos iguales 
a cero. Demostrar que J3 es una base ordenada para V. 

(b) Sea A = [T]p. Calcular A. 

(c) Sea (f> la representación estándar de V con respecto a /3. Entonces 
L A <j> = </>T por el Teorema 2.25. Verificar esta igualdad para la 
matriz 



esto es, demostrar que Lj</>(M) — <f>T(M). 

18.* Sea T: V —> W una transformación lineal de un espacio vectorial n-dimen- 
sional V a un espacio m-dimensional W. Sean t (3 y y bases ordenadas para 
V y W, respectivamente. Demostrar que rango(T) = rango(L 4 ) y que nuli- 
dad(T) = nulidad(L j4 ), donde A = [T]*. Sugerencia: Utilizar el Teorema 
2.25 y el Ejercicio 15. 


19. Sean V y W espacios vectoriales dimensionalmente finitos con bases orde- 
nadas f3 = {jc 4 , . . . , x n } y y = [y l7 . . . , y m }, respectivamente. Por el Teo- 
rema 2.7 existe una transformación lineal T iy : V W tal que 


T u (x k ) 


íyi si k = / 

[0 si k j. 


Demostrar primero que (T i; : 1 < / < m, 1 < j < n} es una base para 
£(V, W). Entonces, sea E i] una matriz de m x n con 1 en el renglón 


1 
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i-é simo y la columna /-ésima y 0 en cualquier otro lado, y demostrar que 
Uij]] — E ij . E>e nuevo, por el Teorema 2.7 existe una transformación li- 
neal <ï>: £(V, W) M mxn (F) tal que 4>(T <; ) = E { K Demostrar que $ es 
un isomorfismo. 

20. Sean c 0 , c l9 ... 9 c H elementos distintos de un campo F. E>efínase T: P n (F) 

F n+1 por T(/) = (/(c 0 ), . . . , f(c n )). Demostrar que T es un isomorfis- 
mo. Sugerencia: Utilizar los polinomios de Lagrange asociados con c 0 , 
. . . , c n . 

21. Sea V el espacio vectorial de sucesiones finitas no nulas en F (definido en 
el Ejemplo 5 de la Sección 1.2), y sea W = P(F). Defínase 

T: V—mediante T(<r) = 2 

i = 0 

donde n es el mayor de los enteros con una imagen no nula. E>emostrar 
que T es un isomorfismo. 


2.5 LA MATRIZ DE CAMBIO DE COORDENADAS 


En muchas áreas de las matemáticas se utiliza a menudo un cambio de 
variable para simplificar la apariencia de una expresión. Por ejemplo, en 
cálculo puede encontrarse fácilmente una antiderivada de 2 xe p2 haciendo 
el cambio de variable u = x 2 . La expresión que resulta tiene una forma 
tan sencilla que la antiderivada se reconoce fácilmente: 




De la misma forma, en geometría plana puede emplearse el cambio de 
variable 

V5 , , 2VT , -2V5" , , V'T , 

x -— x' + —y y y = —-— x’ + — y’ 


para transformar la ecuación 2x- — 4xy + 5y 2 =1 en la ecuación más 
sencilla 6 (x ') 2 + (y') 2 = 1 de cuya forma se reconoce fácilmente que se 
trata de la ecuación de una elipse. (Veremos en la Sección 7.7 cómo se 
determinó este cambio de variable.) Geométricamente, el cambio de va- 
riable 



equivale a una rotación de los ejes coordenados de manera que los ejes 
x y y coincidan con los ejes x' y y, respectivamente, donde 



y y' 


2 V 5 


-X + 
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(Los valores de x' y y' se encontraron al resolver el sistema 

^J-x' + ìyJ-y' = x 
^ 

para y y' en términos de x y y.) Los vectores obtenidos al someter los 
vectores de la base 



del sistema coordenado x, y a esta rotación son 


lAL \ 

5 


/—2^/3” 


5 

5 > 

y 

\ 5 / 


respectivamente. Estos vectores son vectores unitarios que se alojan en 
el eje x' y el eje y', respectivamente, y por lo tanto forman una nueva 
base 


[l\J \ 

rv*\i 

5 

5 

VH 

[\ 5 / 

\ 5 1) 


para R 2 . 

Surge una interrogante lógica: ^Cómo es posible transformar vectores 
coordenados con respecto a una base, a vectores coordenados con respecto 
a la otra? La respuesta está dada a través de la relación 


Nótese que la matriz 




\ y 'i 



~ 2 V^ \ 


ô = 


5 

5 

2 

v^ 

5 

5 r 

a/T 

-Z/T\ 

5 

5 

i/r 



es igual a [l]*„ donde I es la transformación identidad en R 2 . Entonces por 
el Teorema 2.16 [v]^ = Q[v para toda v £ R 2 . Un resultado similar es 
cierto en general. 

Teorema 2.26. Sean [3 y fi' dos bases ordenadas para un espacio vectoríal di- 
mensionalmente finito V y sea Q = Pvlí'.• Entonces 
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(a) Q e5 inverîible. 

(b) Para toda v e V, [v] p = QIVI^. 

DEMOSTRACIÓN. 

(a) Como l v es invertible, Q también lo es por el Teorema 2.21. 

(b) Para toda v e V, 

[v] fi = [I v(v)]fi = [l v l m? = <Mr 

por el Teorema 2.16. ■ 

La matriz Q definida en el Teorema 2.26 se llama matriz de cambio 
de coordenadas. A causa del inciso (b) del teorema decimos que Q trans - 
forma las coordenadas de en coordenadas de p. Obsérvese que si 
fi = {*i, x 29 , x n ) y p = {x' v x! v . . ., x'J, entonces 

•*' = 2 QuXi 

i = 1 

para /—1,2,... n; esto es, la columna y-ésima de Q es [x'.]p. 

Ejemplo 31. Sea V - R 2 , fi = {(1, 1), (1, -1)}, y fi' te {(2, 4), (3, 
1)}. Como (2, 4) = 3(1, 1) - 1(1, -1) y (3, 1) = 2(1, 1) + 1(1, 
— 1), la matriz que transforma las coordenadas de fi' en coordenadas 
de fi es 



Así, por ejemplo, 

[(2, 4)]* = 0(2, 4)]p. = ô (Ì) = (_j) • 

Supóngase ahora que T: V es una transformación lineal entre 
espacios vectoriales dimensionalmente finitos y que y fi' son bases orde- 
nadas para V y y y y' son bases ordenadas para W. Entonces T se puede 
representar por matrices relativas a j8 y y y relativas a y y'. ^Cuál 
es la relación entre las matrices [T]J y [T]£? La respuesta se ve clara- 
mente de las ecuaciones [J(v)] y = [T]J[v], y [T(tO]/ = [T Yy[v\y dadas 

por el Teorema 2.16, porque si Q y P son matrices de cambio de coor- 
denadas que transforman coordenadas de J3' en coordenadas de y 
coordenadas de y' en coordenadas y, respectivamente, entonces de estas 
ecuaciones es evidente que hay dos métodos para obtener [T(v)] y a partir 
de [v ] p ,, como se ilustra en la figura 2 . 3 . 

Como [T ] 7 fiQ[v] p , = P[ J] 7 fi'[v] p , para toda v e V, el Teorema 2.17(b) 
implica que [T ] y fi Q — P[T]J'. A1 ser P invertible (Teorema 2.26), esto da 
la respuesta a la pregunta anterior. 
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Teorema 2.27. Sea T: V —» W una íransformación lineal de un espacio vec- 
îorial V dimensionalmenîe finito a un espacio vectorial W dimensionalmen- 
te finito, y sean fì y /3' bases ordenadas para V y y y y' bases ordenadas 
para W. Entonces [T]^ = P _1 [T]^Q, donde Q es la matriz que transforma 
las coordenadas de fi' en coordenadas de £} y P es la matriz que transforma 
las coordenadas de y en coordenadas de y. 


Multiplicar por [T]£. 

Ivìf -►[T(w)]y 


Multiplicar por Q 
(para transformar 
coordenadas de j3' en 
coordenadas de p). 


| Multiplicar por[T]JJ. 

M, - 


Multiplicar por P 
(para transformar 
coordenadas de y' en 
coordenadas de y). 


[T(v)] y 


figura 2.3 


Ejemplo 32. Sean V = R 3 , W = R 2 y T: V W definida mediante 



Sean /3 y y las bases ordenadas estándar para R 3 y R 2 , respectivamente, 
y sean 



(Obsérvese que /3' y y' son bases ordenadas para R ! y R 2 , respectivamente.) 
Verificaremos el Teorema 2.27. Tenemos que 


[T]; 


(î: 



y = 



y algunos cálculos fáciles muestran que las matrices de cambio de coor- 
denadas que transforman coordenadas de J3' en coordenadas de p y 
coordenadas de y' en coordenadas de y son 
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respectivamente. En la Sección 3.2 se presentará un método para calcular 
P 1 ; mientras tanto, verifíquese que 



Una multiplicación fácil muestra que [T]^; = P -1 [T]JÔ- 

Un caso particular importante del resultado anterior se tiene cuando 
V = W. Es esta la situación que nos ocupará primordialmente en una gran 
parte del resto del libro. En este caso el teorema toma la siguiente forma. 

Corofor/o. Sea T: V —» V una iransformación lineal en un espacio vecîorial di- 
mensionalmente finito V que tiene bases ordenadas f3 y J3'. Entonces 
[T]p' = Q^tTJpQ, donde Q es la matriz que transforma coordenadas de 
J3 ' en coordenadas de [3. 

La relación entre las matrices [T]^ y [T]^ del corolario anterior serán 
temas de estudio en los Capítulos 5 y 6 . Sin embargo, introduciremos ahora 
el nombre de esta relación. 

Definición. Sean A y B matrices de n x n con elementos del campo F. Deci - 
mos que B es similar a A si existe una matriz invertible O £M nxn (F) tal 
que B = Q^AQ. 

Obsérvese que la relación de similaridad es una relación de equiva- 
lencia. (Ver el Ejercicio 7.) 

Nótese también que en esta terminología el corolario anterior puede 
enunciarse de la manera siguiente: Si T: V—»V es una transformación 
lineal en un espacio vectorial dimensionalmente finito V, si t f3 y /3' son 
bases ordenadas cualesquiera para V, entonces [T]^ es similar a [T]^. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Si Q es la matriz de cambio de coordenadas que transforma las 
coordenadas de J3' en coordenadas de J3 , donde J3' = (jc', . .., x' } y 
J3 — {ati, . .. , x n } son bases ordenadas para un espacio vectorial, 
entonces la columna /-ésima de Q es [Xj]p>. 

(b) Toda matriz de cambio de coordenadas es invertible. 

(c) Sea T: V->W una transformación lineal de un espacio vectorial di- 
mensionalmente finito V a un espacio vectorial dimensionalmente 
finito W, y sean f3 y /?' bases ordenadas para V y y y y' bases ordenadas 
para W. Entonces [T]j; '= PU] y fi Q, donde Q y P son las matrices de 
cambio de coordenadas que transforman coordenadas de J3' en coor- 
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denadas de J3 y coordenadas de y en coordenadas de y', respecti- 
vamente. 

(d) Las matrices A, fiÇM nxn (F) se llaman similares si B = para 

alguna Q ÇM nxn (F). 

(e) Sea T: V—»V una transformación lineal en un espacio vectorial di- 
mensionalmente finito V. Entonces para cualquier par de bases orde- 
nadas J3 y y para V, [T]p es similar a [T] y . 

2. Para cada uno de los siguientes pares de bases ordenadas (3 y /3’ para R 2 , 
encontrar la matriz de cambio de coordenadas que transforma coordenadas 
de j3 r en coordenadas de J3. 

(a) jì = {e„ e 2 } y = {(a„ a 2 ), (í>„ è 2 )} 

(b) j 8 = {(-1. 3), (2, -1)} y /?' = {(0, 10), (5, 0)} 

(c) fi= {(2, 5), (-1, -3)} y j 8 ' = {e„ e 2 } 

(d) j 8 = {(-4, 3), (2, -1)} y j 6 ' = {(2, 1), (-4, 1)} 

3. Para cada uno de los siguientes pares de bases ordenadas j 8 y j 8 ' para 
P 2 ()î), encontrar la matriz de cambio de coordenadas que transforma las 
coordenadas de j 8 ' en coordenadas de J3. 

(a) = {x 2 , x, 1 } y 

j 8 ' = {a 2 x 2 + aiX + a 0 , b 2 X- + b^x + b 0 , c 2 x 2 + c x x + c 0 } 

(b) j 8 = { 1 , x, x 2 } y 

j8' = {a 2 x 2 + a,x + a 0 , b 2 x 2 + b^x + b 0 , c>x 2 + c,x + c 0 } 

(c) j8i= { 2x 2 - x, 3x 2 + 1, x 2 } y j 8 ''= {1, x, x 2 } 

(d) j 8 i= {x 2 — x + 1, x + 1, x 2 + 1} y j 8 ' = {* 2 + x + 4, 

4x 2 - 3x + 2, 2x 2 + 3} 

(e) j 8 = {x 2 — x, x 2 + ï, x — 1} y j 8 ' = {5+' — 2x — 3, 

—2x 2 + 5* + 5, 2x 2 — x — 3} 

(f) j 8 = {2x 2 - x + 1, x 2 + 3x - 2, -x 2 + 2x + 1} y j3' = {9^: - 9, 
x 2 + 21 jc - 2, 3jc 2 + 5x + 2} 


4. Sea V = R 2 , W = R 3 y T: V —> W esté definida mediante 



/ 3a, - a 2 \ 

I 2a, + 4a 2 J. 
\—a, + aj 


Sean j8 y y bases ordenadas estándar para R 2 y R 3 , respectivamente, y 
sean 



m 
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(a) Calcular A = [T]J y B = [T£. 

(b) Calcular Q, la matriz de cambio de coordenadas que transforma las 
coordenadas de J3' en coordenadas de fi, y P, la matriz de cambio 
de coordenadas que transforma coordenadas de y' en coordenadas 
de y. 

(c) Verificar que B >= P X AQ, considerando que 


/1 0 


p - 1 = i i 

\o 0 



5. Sea T: Pi(P) -> Pi(P) definida por T (p) = p', la derivada de pÇPi(P) 
Sean = {1, x) y = {1 + x, 1 — jc}. 

(a) Encontrar la matriz de cambio de coordenadas Q que transforma las 
coordenadas de B' en coordenadas de 

(b) Encontrar Q 1 . (Ver el Ejemplo 32.) 

(c) Calcular A = [T]p y B = [T]^ y verificar que B = Ô’Mg. 

6. Demostrar el corolario del Teorema 2.21. 

7. Recordando la definición de una relación de equivalencia dada en el Apén- 
dice A, demostrar que la relación u es similar a” es una relación de equiva- 
lencia sobre M rtxin (P). 

8. Demostrar que si A y B son matrices semejantes de n x n, entonces tr(y4) 
= tr(B). Sugerencia: Utilizar el Ejercicio 12 de la Sección 2.3. 

9. Sea V un espacio vectorial dimensionalmente finito con bases ordenadas 

«, fi y r- 

(a) Demostrar que si Q y R son las matrices de cambio de coordenadas 
que transforman coordenadas de a en coordenadas de y coorde- 
nadas de J3 en coordenadas de y, respectivamente, entonces RQ es 
la matriz de cambio de coordenadas que transforma coordenadas de 
a en coordenadas de y. 

(b) Demostrar que si Q transforma coordenadas de a en coordenadas de 
/3, entonces Q 1 transforma coordenadas de /3 en coordenadas de a. 

10. Sea A una matriz de m x n con elementos de un campo F, y sean J3 y y 
bases ordenadas para F 11 y F m , respectivamente. Sea B — [L^. Demostrar 
que B = P X AQ donde P es la matriz de m x m con la columna /-ésima 
igual al vector j-é simo en B y Q es la matriz de n x n con la columna 
/-ésima igual al vector /-ésimo en y. 
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11. * Sea V un espacio vectorial dimensionalmente finito sobre un campo F y 

sea p = {jci, . . . , *»} una base ordenada para V. Sea Q una matriz inver- 
tible de n x n con elementos de F. Defínase 

n 

x'i = 2 QijX, paca 1 < j < n, 

i — 1 

y hágase / 3' — {*', . . ., x' n ). Demostrar que fi' es una base para V y por 
lo tanto Q es la matriz de cambio de coordenadas que transforma coorde- 
nadas de p' en coordenadas de fi. 

12. * Demostrar la recíproca de Teorema 2.27: Si A y B son ambas matrices 

de m x n sobre un campo F y existen matrices invertibles P y Q de m x m 
y n x n, respectivamente, tales que B = PAQ, entonces existen un espacio 
vectorial /i-dimensional V y un espacio vectorial m-dimensional W (ambos 
sobre F), bases ordenadas /? y fi' para V y y y y' para W y una transfor- 
mación lineal T: V-^ W tal que 

A = mi y fl = [T]; ( . 

Sugerencias: Sean V = F n , W = F m , T = L A y f$ y y bases ordenadas están- 
dar para F n y F ,n , respectivamente. Sea fS' una base ordenada para V obte- 
nida a partir de /3 a través de Q (de acuerdo con la definición dada en 
la página 106 y justificada por el Ejercicio 11), y sea y' la base para W 
obtenida de y a través de P~\ 

2.6* ESPACIOS DUALES 

En esta sección nos interesaremos exclusivamente en las transformaciones 
lineales de un espacio vectorial V en su campo de escalares F, que a su 
vez es un espacio vectorial de dimensión 1 sobre F. Tal transformación 
lineal se llama funcional lineal en V. En el cálculo, la integral definida nos 
proporciona uno de los ejemplos más importantes en matemáticas de 
una funcional lineal. (Ver Ejemplo 33.) Utilizaremos generalmente las 
letras f, g, h, . . . para denotar a las funcionales lineales. 

Ejemplo 33. Sea V el espacio vectorial de funciones continuas complejas 
(o reales) sobre el intervalo [a, b]. La función f: V—»C (o R ) defini- 
da por 

f(-ï) = J' x(t)dt 

es una funcional lineal en V. Si el intervalo es [0, 2?r] y n es un entero, 
la función definida por 

h„(AT) = L f x(t)e- in/ dt 

2 * Jo 
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también es una funcional lineal. En los textos de análisis al escalar h n (jc) 
se le llama el n-ésimo coeficiente de Fourier de x. 

Ejemplo 34. Sea V = M mxn (F) y defínase f: V —> F por f (A) — tr (A), 
la traza de A. Por el Ejercicio 6 de la Sección 1.3, tenemos que f es una 
funcional lineal. 


Ejemplo 35. Sea V un espacio vectorial dimensionalmente finito con la 
base ordenada J3 = {x u x 2 , ... , x n }. Para cada n, defínase 

fi(^) = ûi, donde 


( a '\ 


[x] P = 


\aj 


es el vector de coordenadas de x relativo a fi. Entonces U es una funcional 
lineal en V llamada la ì-ésima función coordenada con respecto a la 
base /3. Nótese que fj (Xj) = Estas funcionales lineales jugarán un 
papel muy importante en la teoría de los espacios duales. (Ver el Teore- 
ma 2.28.) 


Definición. Fara un espacio vectorial V sobre F, definimos al espacio dual de 

V como el espacio vectorial I(V, F), denotado por V*. 

Por tanto, V* es el espacio vectorial que consta de todas las funcio- 
nales lineales en V con las operaciones de suma y de multiplicación por 
escalares tal como se definieron en la Sección 2.2. Nótese que si V es 
dimensionalmente finito, entonces dim(V*) = dim(£(V, F)) = dim(V) • 
dim(F) = dim(V). Por lo tanto, por eì Teorema 2.22, V y V* son iso- 
morfos. También podemos definir el doble dual V** de V como el dual 
de V*. Demostraremos, de hecho, que existe una identificación natural de 

V y V**. 

Teorema 2.28. Supóngase que V es un espacio vectorial dimensionalmente fini - 
to con la base ordenada J3 = {x a , . . . , x n ). Sean fi(l < i < n) las fun- 
ciones coordenadas con respecto a /3 tal como se definieron anteriormente 
y sea J3* = {f l5 . . . , f n }. Entonces /3* es una base ordenada para V*, 
y para cualquier f ÇV* tenemos que 

f = 2 f(Xi)fi. 

i = 1 


Lìamamos a J3* la base dual de J3. 
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demostración. Sea f£V*. Como dim(V*) = n, sólo necesitamos pro- 
bar que 

f = 2f(*i)fi, 

i = 1 

porque entonces fi* generará a V*. Sea 

9 = 2 

i = 1 

Para 1 < / < n, tenemos que 

9 (■*,) - ( 2 f(JTi)fi) (*,) = 2 f(*i)fi(*,) 

\i = l / i = l 

= 2 = HXj). 


Por lo tanto, por el corolario del Teorema 2.7, g = f, por lo que el teore- 
ma queda demostrado. ■ 

Ejemplo 36. Sea J3 — {(2, 1), (3, 1)} una base ordenada para R 2 . De- 
terminaremos explícitamente la base dual J3* = (fi, f 2 } de J3. Necesitamos 
considerar las ecuaciones: 

1 = fi( 2 , 1 ) = U{2e x + e 2 ) = 2h( ei ) + h(e 2 ) 

0 - fi(3, 1) - fx(3^ + e 2 ) = 3í x ( ei ) + +(c 2 ). 


Resolviéndolas tenemos que fi(tfi) = — 1 y fi(e 2 ) — 3 es decir que 
f x (x, y ) = ~~x + 3 y. De manera semejante puede probarse que f 2 (x, 
y) = x —2y. 

Ahora supondremos que V y W son espacios vectoriales dimensional- 
mente finitos sobre F con bases ordenadas /3 y y, respectivamente. En la 
Sección 2.4 demostramos que existe una correspondencia uno-a-uno entre 
las transformaciones lineales T: V W y las matrices de m x n (sobre 
F) por medio de la correspondencia T [T],. Para una matriz de la for- 
ma A = [T]*, la pregunta es si existe o no una transformación lineal U 
asociada con T de alguna manera natural tal que U pueda representarse 
en alguna base como A f . Por supuesto, si m=+/î, sería imposible para U 
ser una transformación lineal de V en W. Resolveremos esta pregunta 
aplicando lo que ya hemos aprendido sobre espacios duales. 

Teorema 2.29. Sean V y W espacios vectoriales dimensionaimente finilos sobre 
F con bases ordenadas j3 y y, respectivamente. Para cualquier transforma- 
ción lineal T : V^W , el mapeo V: W* -> V* definido por T*(g) = 
goT para toda g ÇW* es una transformación lineal con la propiedad de 
que [+]*: = ([T ];y. 
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demostración. Para g ÇW*, es evidente que T*(g) = g o T es una fun- 
ción lineal en V y por lo tanto es un elemento de V*. Así, T* mapea a W* 
en V*. Dejaremos al lector la demostración de que T f es lineal. 

Para completar la demostraçión sean J3 = {jc i5 . . . , x n } y y = 

. . • , y m } con bases duales fi* = {fi, . .. , f„} y y* = {gi, . .. , gm}, res- 
pectivamente. Por conveniencia, sean A = [T]J y B — [T- f ]J*. Entonces 

m 

TUi) = 2 Akiy* para 1 < i < n, 

k =1 

y 

T f (g/) = 2 BijU para 1 < / < m. 

i = l 

Debemos demostrar que B — A*. E1 Teorema 2.28 muestra que 
T*(g # ) = g/ o T = 2 (g,- 0 T) (jri)fi, 

i = 1 

y entonces 

/ rn 

Bij = (gj°T)Oi) - gj(T {xì )) = g,- ( 2 A ki y* 

\k = i 

m m 

^ A kï $j(y k ) 2 A k \^j k Aji • (A*)ij, 

k =ì k=l 

Por lo tanto B = A f . | 

La transformación lineal T f definida en el Teorema 2.29 se llama trans- 
puesta de T. Es evidente que V es la única transformación lineal U tal 
que [U];:= cm ;y. 

Ahora nos ocuparemos de la demostración de que cualquier espacio 
vectorial dimensionalmente finito V puede ser identificado de una manera 
muy natural con su doble dual V**. Produciremos, de hecho, un isomor- 
fismo entre V y V** que no dependerá de ninguna selección de bases para 
los dos espacios vectoriales. 

Para un vector jc £ V definimos x : V* —> F por x(f) = f(;c) para toda 
f£V*. Es fácil verificar que x es una funcional lineal en V* y entonces 
jc Ç V**. La correspondencia nos permitirá definir el isomorfismo 

deseado entre V y V**. 

Lema . Sea V un espacio vectorial dimensionalmente finito y sea x£V. Si 
£ (f) =0 para toda f £V*, entonces x = 0. 

demostración. Si jc =£ 0 entonces podemos tomar una base ordenada 
J3 = {jci, . . . , jc„} para V tal que jc x — jc. Sea {f 1? . . . , f w } la base dual 
de fi. Entonces se tiene que fi(Xj) = 1^0 lo que es una contradicción. 
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Teorema 2.30. Sea V un espacio vecíorial dimensionalmente finito y sea ỳ: 
V —> V** que esté dejiráda por ^(x) — %. Entonces ỳ es un isomorfismo. 

DEMOSTRACIÓN. 

(a) ỳ es lineal: Sea x, y ÇV y a£F. Para f £V* tenemos que 

Ý(x + ay)( f) = f(x + ay) = f(x) + aï(y) = x(f) + aj)(f) 
&(*+aŷ)(f). 

Por lo tanto 


+ ay) = x + aỳ — ^(x) + «ý(y). 

(b) ỳ es uno-a~uno: Supóngase que ý(;t) es la funcional cero en V* 
para alguna xÇV. Entonces x(f) = 0 para toda f £V*. Por el lema ante- 
rior concluimos que x = 0. 

(c) ij/ es un isomorfismo: Esto se deduce de (b) y del hecho de que 

dim(V) = dim(V**). ■ 

Corofar/o. Sca V ún espacio vectorial dimensionalmente finito con un espacio 
dual V*. Entonces, toda base ordenada de V* cs la base dual de alguna 
base de V. 

DEMOSTRACiÓN. Sea {+, ... , f n } una base ordenada de V*. Podemos 
combinar los Teoremas 2.28 y 2.30 para concluir que para esta base de 
V* existe una base dual [x u . . ., x n } en V**, esto es = jc,(f ; ) = f )(xì). 
Por tanto {f l5 . .. , f„) es la base dual de [x u . . . , x n ). ■ 

Aun cuando muchas de las ideas de esta sección se pueden extender 
para el caso donde V no es dimensionalmente finito, por ejemplo la exis- 
tencia de un espacio dual, únicamente un espacio vectorial dimensionalmen- 
te finito es isomorfo a su doble dual a través del mapeo x —* x. De hecho, 
para espacios vectoriales dimensionalmente infinitos, V y V* nunca son 
isomorfos. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
todos los espacios vectoriales son dimensionalmente finitos. 

(a) Toda transformación lineal es una funcional lineal. 

(b) Una funcional lineal definida en un campo puede ser representada 
como una matriz de 1 x 1. 

(c) Todo espacio vectorial es isomorfo a su espacio dual. 

(d) Todo espacio vectorial es el dual de algún otro espacio vectorial. 

(e) Si T es un isomorfismo de V en V* y B es una base ordenada finita 
de V, entonces T(/?) = J3*. 
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(f) Si T es una transformación lineal de V en W, entonces el dominio 
de (T*)* es V**. 

(g) Si V es isomorfo a W, entonces V* es isomorfo a W*. 

(h) La derivada de una función puede considerarse como una funcional 
lineal en el espacio vectorial de funciones diferenciables. 

2. Para las siguientes funciones en un espacio vectorial V, determinar cuáles 
son funcionales lineales. 

(a) V — P(i?); f (p) = 2p'(0) + p"( 1), donde ' significa diferenciación 

(b) V = R 2 ; f(x, y) = (2x, 4 y) 

(c) V - M 2 x 2 (F); f(A) = tr (A) 

(d) V = R 3 ; f(x, y, z) = x 2 + y 2 + z 2 

(e) V= P(R);f(p) = £ P (Odí 

(f) V = M 2 x 2 (K); fG4) = A U 

3. Como en el Ejemplo 36, para todos los espacios vectoriales V y bases B 
que aparecen a continuación, encontrar la base dual jì* para V*. 

(a) V = R 3 ; /3 = {(1, 0, 1), (1,2, 1), (0,0, 1)} 

(b) V= P 2 (/?);/? = {l,*,* 2 } 

4. Sea V = R 3 y defínase f 1? f 2 , f 3 £V* mediante fi(^, y, z) = x — 1y, f 2 (;t, y, 
z) = x + y + z, y f 3 (*, y, z) — y — 3 z. Demostrar que {f l5 f 2 , f 3 } es una 
base para V* y luego encontrar una base para V para la cual sea el dual. 


5. Sea V = P a (R) y para p€V defínase f 1( f 2 £V* mediante 


fi 00 = f g p(^ dí 

UP) = f 2 p( t)di. 


Demostrar que {f u f 2 ) es una base para V* y encontrar una base para V 
para la cual sea el dual. 


6 . Defínase f£(R 2 )* mediante f(jc, y) — 2x + y y T: R 2 R 2 mediante 
T(:c, y) = (3x + 2y, x). 

(a) Calcular T*(f). 

(b) Calcular [T^J^donde es la base ordenada estándar para R 2 y /?* - 
{fi, f 2 } encontrando escalares a, b, c y d tales que T'(fx) = af t + bf 2 
y T*(f 2 ) = cL + df 2 . 

(c) Calcular [T]^ y [T]j y comparar los resultados con los del inciso 

(b). 
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Sean V = Pi (R) y W = R 2 con sus respectivas bases ordenadas 0 = {1, *} 
y y = {e„ e 2 }. Defínase T: V —>W mediante T (p) = (p( 0) — 2p(l), 
p( 0 ) + p'( 0 )), donde p' es la derivada de p. 

(a) Si f £W* está definida por 

f(a, b) = a — 2 b, 

calcular T ( (f). 

(b) Calcular [T']'’* sin recurrir al Teorema 2.29. 

(c) Calcular [T]{ y su transpuesta y comparar el resultado con el del in- 
ciso (b). 

Demostrar que todo plano que pasa por el origan en R 3 puede ser identifi- 
cado con el espacio nulo de un elemento en (R 3 )*. Enunciar un resultado 
semejante en R 2 . 

Sea T una función de F» en F m . Demostrar que T es lineal si y sólo si existen 
f„ . .. , f m € (F n )* tales que T(x) = (fi (jc) , . . . , f m (x)) para toda x£? n . 
Sugerencia: Si T es lineal, defínase f;(x) = (g ; ° T)(x) para x Ç F n ; es de- 
cir, f, = T'fg») para 1 < i < m, donde (g„ . . . , g m ) es la base dual de 
la base ordenada estándar de F m . 


Sea V = P n (F) y sean c 0 , ... , c n , escalares distintos en F. 

(a) Para 0 < i < n defínase f,- ÇV* mediante fj(p) = p(ci). Demostrar 
que {f 0 , . . . , f„} es una base de V*. Sugerencia: Aplicar cualquier 
combinación lineal de este conjunto que iguale la transformación cero 
con p(t) = (t - Cx)(t - c 2 ) •• • (t - c„) y deducir que el primer 
coeficiente es cero. 

(b) Utilizar el corolario del Teorema 2.30 y el inciso (a) para demostrar 
que existen polinomios únicos p 0 , . . • , Pn tales que Pi(Cj) = Sìì para 
0 < i < n. Estos polinomios son los polinomios de Lagrange defini- 
dos en la Sección 1.6. 

(c) Para escalares cualesquiera a 0 , . . . , a n (no necesariamente distintos), 
dedúzcase que existe un polinomio único q de grado n tal que 
q(Cï) — ûì para 0 < i < n. De hecho 

n 

q = 2 aiPi. 

X - 0 

(d) Deducir la fármula de interpolación de Lagrange: 


para toda p Ç V. 
(e) Demostrar que 


P 


2 p(ci)Pi 


i -0 



n 

p(t)dt = 2 P(c,)di, 

i = 0 
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donde 

dt = f Pi(t)dí. 


Supóngase ahora que 



n 


para ì = 0,. . ., n. 


Para n = 1 la expresión anterior representa la regla trapezoidal para 
polinomios. Para n = 2, comparar el resultado con la regla de Simp- 
son para polinomios. 


11. Sean V y W espacios vectoriales dimensionalmente finitos sobre F , y sean 
if/t y \j/ 2 isomorfismos entre VyV**yWyW**, respectivamente, tal como 
se definieron en el Teorema 2.30. Sea T: V —»W lineal, y defínase 
jíí = (T*)*. Demostrar que el diagrama de la figura 2.4 conmuta, es decir, 
que T = T%. 


^2 


T" 

figura 2.4 

12. Sea V un espacio vectorial dimensionalmente finito con Ia base ordenada 
J3- Demostrar que ^(/3) = /?**, donde ỳ es como se definió en el Teore- 
ma 2.30. 

Para los problemas 13 a 17, V será un espacio vectorial dimensional- 
mente finito sobre F. Si S es un subconjunto de V, definimos al aniquilador 
S° de S como S° = {f £V*: f (jc) = 0 para toda JtÇS}. 

13. (a) Demostrar que *S° es un subespacio de V*. 

(b) Si W es un subespacio de V y x^W, demostrar que existe f ÇW° tal 
que f (jc) ŷéz 0. 

(c) Demostrar que S 00 = L(^(S)), donde \j/ es como se definió en el 
Teorema 2.30. 

(d) Para los subespacios W^ y W 2 , demostrar que W t = W 2 si y sólo si 

W° = W°. 

1 2 

(e) Para los subespacios W, y W 2 , demostrar que (W^ + W 2 )° = 

w° n w°. 
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14. Si W es un subespacio de V, demostrar que dim(W) + dim(W°) = dim(V). 
Sugerencia: Sea {x u ... , x k } una base ordenada de W y extiéndase a 
una base ordenada J3 = {a:i, . .. , x n ) de V. Sea fi* — {fi, . .. , f n }. I>e- 
mostrar que {f* +1 , . . . , f w } es una base de W°. 

15 . Supóngase que W es un espacio vectorial dimensionalmente finito sobre F 
y que T: V-^W es lineal. Demostrar que N(T*) = (R(T))°. 

16 . Utilizar los Ejercicios 14 y 15 para deducir que rango(/4) = rango(^4*) 
para toda A £M mxll (F). 

17. Sea T: V V una transformación lineal y W un subespacio de V. Demos- 
trar que W es T-invariante (tal como se definió en el Ejercicio 24 de la 
Sección 2.1) si y sólo si W° es TMnvariante. 


2 .7* ECUACIONES DIFERENCIALES LINEALES HOMOCENEAS 
CON COEFICIENTES CONSTANTES 

A manera de introducción a esta sección, consideremos el siguiente pro- 
blema físico. Un peso de masa m se sujeta a un resorte suspendido verti- 
calmente al que se le permite elongarse hasta que las fuerzas que obran 
sobre el peso están en equilibrio. Sujx)ngamos ahora que el peso permane- 
ce en reposo y superpongamos un sistema coordenado XY con el peso 
en el origen y el resorte localizado en la parte superior del eje Y. (Ver 
Fig. 2.5.) 


Y 



Supóngase que en un cierto instante, por ejemplo t = 0, el peso se 
hace descender una distancia í a lo largo del eje Y y luego se suelta. 
Entonces el resorte empezará a oscilar. 

Describamos el movimiento del resorte. En cualquier instante t > 0, 
sea F(t) la fuerza que actúa sobre el peso y y(t) sea ìa coordenada del 


1 
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peso a lo largo del eje Y . Por ejemplo, ;y(0) = —s. La segunda derivada 
de y con respecto al tiempo, y"(t ), es la aceleración del peso en el ins- 
tante /, y por lo tanto de acuerdo con la segunda ley de Nevvton 

F(t) = my"(t). (1) 

Es razonable suponer que la fuerza que actúa sobre el peso se debe 
totalmente a la tensión del resorte y que esta fuerza satisface la ley de 
Hooke: La fuerza que actúa sobre el peso es proporcional a su despía- 
zamiento a partir de la posición de equilibrio, pero en direccion opuesta. 
Si k > 0 es la constante de proporcionalidad, entonces la ley de Hooke 
establece que 

F(t) = —ky(t). (2) 

Combinando las ecuaciones (1) y (2), obtenemos 

my" — —ky 

o bien 

y" + — y = 0. (3) 

m 

La expresión de la ecuación (3) es un ejemplo de “ecuación diferen- 
cial”. Una ecuación diferencial en una función incógnita y = y(t) es una 
ecuación que involucra a y, a t y a las derivadas de y. Si la ecuación 
diferencial es de la forma 

a n y w + + . .. + a,y (1) + a 0 y = f, (4) 

donde a n , a u . .. , a^ y / son funciones de t y y ik) es la /c-ésima derivada 
de y, entonces se dice que la ecuación es lineal. Las funciones a, se deno- 
minan coeficientes de la ecuación diferencial lineal (4). Así, la ecuación 
(3) es un ejemplo de ecuación diferencial lineal en donde los coeficientes 
son constantes y la función / es idéntica a cero.-Cuando la función / de 
la ecuación (4) es idéntica a cero, la ecuación diferencial lineal se llama 
homogénea. 

En esta sección aplicaremos el álgebra lineal que hemos estudiado 
para resolver ecuaciones diferenciales lineales homogéneas con coeficien- 
tes constantes. Si a n 0, decimos que la ecuacion diferencial (4) es de 
orden n. En este caso podemos dividir ambos lados entre a„ para obtener 
una ecuación nueva pero equivalente 

y (n) + b„-,y in - u + . . . + b,y w + b 0 y = 0, 

donde b, = a-./on para i = 0, 11. A causa de esta observación 
supondremos siempre que el coeficiente inicial a„ de la ecuación (4) es 1. 

Una solución a la ecuación (4) es una función tal que cuando se subs- 
tituye en y reduce la ecuación (4) a una identidad. 
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Ejemplo 37. La función y(/) = sen V kjmt es una solución a la ecua- 
ción (3) puesto que 

k k I k k lk 

y"(t) + —v(0 = —— sen \— t + — sen \— t — 0 

J m m Im m 1 m 

para toda t. Nótese, sin embargo, que al substituir y(0 ■= t en la ecua- 
ción (3) se obtiene 

y"(t) + —y(t) = \ 

m m 

lo cual no es idénticamente cero. Por tanto, y(t) = t no es solución a la 
ecuación (3). 

A1 intentar resolver ecuaciones diferenciales, descubriremos que es de 
utilidad considerar las soluciones como funciones complejas de una varia- 
ble real, aun cuando las soluciones que para nosotros tienen significado 
son las funciones reales de variable real. La conveniencia de este punto 
de vista se hará más claro posteriormente. Así, nos ocuparemos del espa- 
cio vectorial J(R, C) (tal como se definió en el Ejemplo 3 de la Sec- 
ción 1.2). A fin de considerar a las funciones complejas de variable real 
como soluciones a las ecuaciones diferenciales debemos definir lo que 
significa diferenciar tales funciones. Dada una función compleja x Ç.J(R, C) 
de una variable real t , existen funciones reales únicas x x y x 2 de t, tales que 

x(t) = JCi(0 + ix 2 (t) para t£R, 

donde i es el número imaginario puro tal que i 2 ~ —1. Decimos que x x 
es la parte real y que x 2 es la parte imaginaria de x. 

Definición. Dada una función x£?(R, C) con parte real x t y parte imaginaria 
x 2 , decimos que x es diferenciable si Xi y x 2 son diferenciables. Si x es 
diferenciable definimos la derivada de x, x' como 

x' — x' x + ix'. 

Ejemplo 38. Si x(t) = cos 2t + / sen 2 1, entonces 
x '(t) = —2 sen 2t + í(2 cos 20- 

Determinamos a continuación la parte real e imaginaria de x . Como 
x 2 (t) = (cos 2 1 + i sen 2t) 2 = (cos 2 2t - sen 2 20 + i(2 sen 2 1 cos 2t) 

= cos 4 1 + i sen At, 

la parte real de jc 2 (0 es cos 4 1 y la parte imaginaria es sen 4 1 . 

E1 teorema siguiente indica que debemos limitar nuestras investigacio- 
nes a un espacio vectorial considerablemente menor que 7(R, C). Su de- 


122 Transformaciones lineales y matrices 

mostración, ilustrada en el Ejemplo 39, implica un sencillo argumento de 
inducción, la cual omitiremos. 

Teorema 2.31. Cualquier solución a una ecuación diferencial lineal homogénea 
con coeficientes constantes tiene derivadas de todos los órdenes; esto es, 
si x es una solución para tal ecuación, entonces x ík) existe para todo ente- 
ro positivo k. 

Ejemplo 39. Como ilustración del Teorema 2.31 considérese la ecuación 

y (2) + 4y = 0. 

Claramente, para ser calificada como solución, una función y debe tener 
dos derivadas. Sin embargo, si y es una solución, 

y (2) = —4 y. 

Ahora, como y (2> es un múltiplo constante de una función que tiene 
dos derivadas, a saber la función y, y (2) debe tener dos derivadas y enton- 
ces y (i) existe. De hecho 

y ( 4 ) ~ — 4y (2,) . 

Como y (4) es un múltiplo constante de una función que hemos mostrado 
que tiene al menos dos derivadas, también tiene al menos dos derivadas, 
y por lo tanto y (0) existe. Continuando de esta manera podemos demostrar 
que cualquier solución tiene derivadas de todos los órdenes. 

Definición. Uiilizaremos el símbolo C x para representar al conjunto de todas 
las funciones en 7(R, C) que tienen derivadas de todos los órdenes. 

Es un ejercicio sencillo demostrar que C x es un subespacio de 7(7?, C) 
y, por tanto, un espacio vectorial sobre C. Como resultado del Teorema 
2.31 es este espacio vectorial el que nos interesa. Para jcCC x la derivada 
x' de x también está en C x . Podemos utilizar la operación derivada para 
definir un mapeo D: C x —» C x mediante 

D(jc) = jc' para jc ÇC X . 

Es fácil demostrar que D es una transformación lineal. Más generalmente, 
considérese cualquier polinomio sobre C de la forma 

p(t) = a n t n + ûh-A 1 + ... + ad + a {) . 

Entonces 

p( D) = a„D* + a„.. 1 D”" 1 + ... + a.D + a {) I 

es una transformación lineal. (Ver el Apéndice E.) 
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Definiciones. Para cualquier polinomio p(t) sobre C, p(D) se llama operador 
diferencial. El orden del operador diferencial p(D) es el grado del polino- 
mio p(t). 

Los operadores diferenciales son útiles porque nos proporcionan me- 
dios para reformular una ecuación diferencial dentro del contexto del 
álgebra lineal. Cualquier ecuación diferencial lineal homogénea con coefi- 
cientes constantes 

y (n) + On^y (n ~ u + . . . + a x y (x) + a 0 y = 0 

puede ser escrita de nuevo por medio de operadores diferenciales como 
(D n + On-.D^ + . . . + a x D + flol) (y) - 0. 

Definición. Dada la ecuación diferencial anterior, el polinomio complejo 

p(t) = t 11 + a n -it n_1 + . .. + a x t + a 0 
se llama polinomio auxiliar asociado con la ecuación . 

Por ejemplo, la ecuación (3) tiene el polinomio auxiliar 

Pd > = z 2 + —. 

m 

Cualquier ecuación diferencial lineal homogénea con coeficientes cons- 
tantes puede reescribirse como 

p(D)(y) = 0 , 

donde p(t) es el polinomio auxiliar asociado con la ecuación. Claramente 
esta ecuación implica lo siguiente. 

Teorema 2.32. El conjunto de todas las soluciones a una ecuación diferencial 
lineal homogénea con coeficientes constantes coincide con el espacio nulo 
de p(D), donde p(t) es el polinomio auxiliar asociado con îa ecuación. 

Corolario. El conjunto de todas las soluciones a una ecuación diferencial lineal 
homogénea con coeficientes constantes es un subespacio de C°. 

En vista del corolario anterior, llamaremos al conjunto de soluciones 
a una ecuación diferencial lineal homogénea con coeficientes constantes, 
el espacio soiución de la ecuación. Una manera práctica de describir tal 
espacio es encontrar una base para él. Examinaremos una cierta clase de 
funciones que serán de utilidad para encontrar bases para estos espacios 
solución. 

Para un número real 5 1 , ya estamos familiarizados con el número real 
e\ donde e es el número único cuyo logaritmo natural es 1 (esto es, 
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\n(e) = 1). Por ejemplo, conocemos algunas propiedades de la exponen- 
ciación: 

e s+t = e s e l y e~ l — — 
e l 

para cualquier par de números reales s y t. Extenderemos ahora la defi- 
nición de las potencias de e para incluir a los números complejos de tal 
modo que estas propiedades continúen siendo válidas. 

Definición. Sea c = a + ib cualquier número complejo con parîe real a y parte 
imaginaria b. Defínase 

e c — e a (cay b + i sen b). 

Por ejemplo, para c = 2 + /(tt/3), 

e c = e 2 {cos j + i sen = e 2 Q + 

Claramente, si c es real (b = 0), obtenemos el resultado usual e c = e*. 
Puede demostrarse con el uso de identidades trigonométricas que 

e c +d — e c e^ v e~ c — — 

J e c 

para cualquier par de complejos c y d. 

Definición. Sea c cualquier número complejo. La función f: R —* C definida 
por f(t) = e ct para toda t en R se llama función exponencial. 

La derivada de una función exponencial, como se describe en el teore- 
ma siguiente, es como esperaríamos. La demostración implica un cálculo 
directo, aunque tedioso, que dejaremos como ejercicio. 

Teorema 2.33. Para cualquier función exponencial f(t) = e ct , f'(t) — ce ct . 

Utilizaremos funciones exponenciales para describir todas las solucio- 
nes de una ecuación diferencial lineal homogénea de orden 1. Recuérdese 
que el orden de dicha ecuación es igual al grado de su polinomio auxiliar, 
de manera que una ecuación de orden 1 es de la forma 

y f + a 0 y = 0 (5) 

Teorema 2.34. El espacio solución para la ecuación (5) es de dimensión 1 y 
tiene a {e _aot } como base. 

demostración. Claramente, la ecuación (5) tiene a e a oí como solución. 
Supóngase que x(t) es una solución cualquiera a la ecuación (5). En- 
tonces 

x'(t) — —a {) x(t) para toda t£R. 
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Defínase 

z(t) — ef^x (t). 

A1 diferenciar z obtenemos 

z'(t) — (ef^Yx^t) + e aot x'(t) ~= doefo'x^t) — ao^xit) = 0. 

Nótese que la conocida regla para la diferenciación de productos se 
conserva para funciones complejas de variable real. Una justificación impli- 
ca un cálculo directo aunque bastante largo. 

Como z' es idénticamente cero, z es una función constante. De nuevo, 
este hecho, muy conocido para funciones reales de variable real, también 
es cierto para funciones complejas; la demostración, semejante a la que se 
hace para el caso real, implica considerar poy separado las partes real e 
imaginaria de z . Entonces, existe un número complejo c tal que 

z(t) = e“ ot x (/) = c para toda t£R. 

Así, 

x(t) = cer aot . 

De donde concluimos que cualquier miembro del espacio solución de la 
ecuación (5) es una combinación lineal de er aot . ■ 

Otra manera de formular el Teorema 2.34 es la siguiente. 

Corofario. Para cualquier número complejo c, el espacio nulo del operador dife- 
rencial D — c! tiene como base a {e ct }. 

Nos ocuparemos ahora de ecuaciones diferenciales de orden superior 
a uno. Dada una ecuación diferencial lineal homogénea de orden n con 
coeficientes constantes 

y (w) -f On-^y^^ + . .. + «iy (1) + a 0 y = 0 , 
su polinomio auxiliar 

p(t) = f 1 + a n - 1 t n ~ 1 + . . . + a^t + a 0 
se descompone en un producto de factores de grado 1: 

p(t) = (t - CiHí - c 2 ) ... (t - Cn ), 

donde c u c 2 , . . . , c n son números complejos (no necesariamente distintos). 
(Esto se deduce del teorema fundamental del álgebra dado en el Apén- 
dice D.) Entonces 

p( D) = (D - cj) (D - c 2 !) . . • (D — c n l). 

Pero los operadores D — cj conmutan y así, por el Ejercicio 9, tenemos 
que 

N(D — cj) C N(p(D)) para toda i. 
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Como N(p(D)) coincide con el espacio solución de la ecuación diferen- 
cial dada, podemos concluir el siguiente resultado por el corolario del 
Teorema 2.34. 

Teorema 2.35. Sea p(t) el polinomio auxiliar para una ecuación diferencial li- 
neal homogénea con coeficientes constantes. Para cualquier número com- 
plejo c, si c er un cero de p(t), entonces e c ' es una solución a la ecuación 
diferencial. 

Ejemplo 40. Dada la ecuación diferencial 

♦ 

y" ~ 3y' + 2y = 0, 

su polinomio auxiliar p(t) = t 2 - 3t + 2 se puede factorizar como 

P(t) = (t- 1)(/ - 2). 

Por tanto, j>or el Teorema 2.35, e‘ y e 11 son soluciones de la ecuación 
anterior porque c — 1 y c — 2 son ceros de p(t). Como el espacio solu- 
ción de la ecuación anterior es un subespacio de C”, L({e\ e 2t }) se en- 
cuentra en el espacio solución. Es sencillo demostrar que {e*, e 2t ) es 
linealmente independiente y si pudiéramos demostrar que el espacio solu- 
ción es bidimensional, podríamos concluir que {e*, e 2t ) es una base para 
el espacio solución. Este resultado se deduce del teorema siguiente. 

Teorema 2.36. Para cualquier operador diferencial p(D) de orden n, el espa- 
cio nulo de p(D) es un subespacio n-dimensional de C 00 . 

Como preliminares de la demostración del Teorema 2.36 establecere- 
mos dos lemas. 

Lema 1 . El operador diferencial D cl: C°° —> C r es sobreyectivo para cual- 
quier número complejo C. 

demostración. Sea xÇC“. Deseamos encontrar un y £C X tal que 
cl)y x. Defínase una funcion w mediante w(t) = x(t)er ct para 

tÇ_R. 

Claramente, >v (C 1 pues x y e~ ct están en C°°. Sean respectivamente 
W! y w 2 las partes real e imaginaria de vv. Como w£C x , vvì y w 2 son 
diferenciables y por tanto continuas, por lo que tienen antiderivadas, diga- 
mos que son W x y W 2 , tales que W\= w^ y W{ = w„. Defínase W: 

R -> C mediante 

W(t) = W,(t) + iW 2 (t) para tÇR. 

Entonces W ÇC™ y las partes real e imaginaria de W son W, y W ., 
respectivamente. También W' = w. Finalmente, defínase y: R —> C me- 
diante y(t) = W(t)e“ para t ÇR. 


Ecuaciones diferenciales lineales homogéneas 


12 7 


Claramente, y £ C x y como 

(D - cl)y(/) = /(/) - cy(t) 

= IV'COe** + W(t)ce ct - cW(t)e ct 
= w(t)e ct 

= x(t)e^ ct e ct 1 

- *(t), 

(D-c\)y=x. U 

Lema 2. Sea V urt espacio vectorial y supóngase que I j U son operadores li - 
neales en V tales que 

(a) U es sobreyectiva. 

(b) Los espacios nulos de T y U son dimensionalmente finitos. En- 
tonces el espacio nuîo de TU es dimensionalmente finito y 

dim( N(TU)) = J/m(N(T)) + dim( N(U)). 

demostración. Sean p = dim(N(T)), q = dim(N(U)) y [u u u 2 , , 

u v) y {vi, v 2 , ... , v q ) sean bases para N(T) y N(U), respectivamente. 
Como U es sobreyectiva podemos seleccionar para cada i(i = 1, ... , p) 
un elemento Wi ÇV tal que U(w ( ) = u\. Entonces obtenemos un conjunto 
de p elementos {w u w 2 , ... , w p ). Nótese que para cualquier i y /, w^ v ; 
puesto que de otra manera u t = U(wi) = U(v ; ) = 0 lo que es una con- 
tradicción. Por lo tanto, el conjunto 

fi = i W U w 2 , . . . , W p , Vj, . .. , v q ) 

contiene p + q elementos diferentes. Para demostrar el lema es suficiente 
demostrar que es una base para N(TU). 

Demostraremos primero que J3 genera a N(TU). Como para toda w^ 
y vj en 

TU (w t ) = T (u t ) = 0 y TU(Vj) = T (0) = 0 , 
fi Q N(TU). 

Ahora supóngase que vÇN(TU). Entonces 

0 = TU(v) = T(U(v)). 

Así, tenemos que U(v) €N(T) y existirán escalares a u a>, . .. , tales 
que 

U(v) = a x u x + a 2 u 2 + . . . + a p u p 

= U (aiWi + a 2 w 2 + . . . + a p w p ). 

Por lo tanto 

U(v — (tfiVVi + a 2 w 2 + . . . + a p w p )) = 0. 



« 
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Concluimos que v — (a^yv^ + . . . + a p w p ) está en N(U). De aquí se sigue 
que existen escalares b u b . . . , b q tales que 

v — + a 2 w 2 + ... + a p w p ) = b x v x + b 2 v 2 + . . . + b q v q 

o 

% 

v — a x w x + a 2 w 2 + . . . + a p w p + b^v x + b 2 v 2 + . . . + b q v q . 


Por lo tanto J3 genera a N(TU). 

Demostraremos ahora que J3 es linealmente independiente. Sean a u 
a 2 , , a p , b u b 2 , ... , b q escalares arbitrarios tales que 

a^Wi + a 2 w 2 + . . . + a p w p + ^iV^ + b,v 2 + . . . + b q v q — 0. (6) 

Aplicando U en ambos lados de la ecuación (6), obtenemos 


a x u x + a 2 u 2 + . . . + a p u p = 0. 


Como [u u u>, . . . , Up) es linealmente independiente, todas las a^ son cero. 
Así, la ecuación (6) se reduce a 

b{v x + b 2 v 2 + . . . + b q v q = 0. 

Ahora, la independencia lineal de (v x , v 2 , ... , v<J implica que las b^ son 
todas cero. Concluimos entonces que t /3 es una base para N(TU). Por lo 
tanto, N(TU) es dimensionalmente finito y dim(N(TU)) = p + q = dim 
(N(T)) +dim(N(U)). ■ 

demostración del teorema 2.36. La demostración requerirá de un ar- 
gumento de inducción matemática sobre el orden del operador diferencial 
p( D). E1 caso de primer orden coincide con el Teorema 2.34. Entonces, 
para algún entero n > 1 supóngase que el Teorema 2.36 se satisface para 
cualquier operador diferencial de orden menor que n y supóngase que se 
tiene un operador diferencial p(D) de orden n. E1 polinomio p(t) puede 
descomponerse en un producto de dos polinomios 

P(t) = q(t)(t ~ c) 

para algún polinomio q(t) de grado n — 1 y para algún número comple- 
jo c. Entonces, el operador diferencial dado puede reescribirse como 

p(D) =q(D)(D-c\). 

De acuerdo con el Lema 1, D — c\ es sobreyectivo; por el corolario del 
Teorema 2.34 dim(N(D — cl)) = 1; y por la hipótesis de inducción 
dim(N(g(D)) = n — 1. Luego, al aplicar el Lema 2 concluimos que 

dim(N(p(D))) = dim(N(g(D))) + dim(N(D - cl)) 

= (n - 1) + 1 = n. ■ 
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Corofar/o. Para cualquier ecuación diferencial lineal homogénea con coeficientes 
constantes, el espacio solución es un subespacio n-dimensional de C 00 . 

E1 corolario del Teorema 2.36 reduce el problema de encontrar todas 
las soluciones de una ecuación diferencial lineal homogénea de coeficien- 
tes constantes de orden n al problema de encontrar el fconjunto de n solu- 
ciones linealmente independientes de la ecuación. Por los resultados del 
Capítulo 1, cualquier conjunto tal debe ser una base para el espado solu- 
ción. E1 teorema siguiente nos permite encontrar rápidamente una base 
para muchas de estas ecuaciones. En los ejercicios se dan algunas sugeren- 
cias para su demostración. 

Teorema 2.37. Dados n números complejos distintos c^, c 2 , . . . , c^, el conjun- 
to de funciones exponenciales {e Cit , e Czt , . .. , e Cnt } es linealmente inde- 
pendiente. 

Corolario. Para cualquier ecuación diferencial lineal homogénea con coeficientes 
constantes de orden n, si su polinomio auxiliar p(t) tiene n ceros distintos 
c l5 c 2 ,. . ., c n , entonces el conjunto {e Cit , e C;it , . . . , e Cnt ) es una base para 
el espacio solución de la ecuación. 

demostración. Ejercicio. 

Ejemplo 41 . Encontremos todas las soluciones a la ecuación diferencial 

y" + 5y' + 4y = 0. 

Como el polinomio auxiliar p(t) se puede factorizar como (/ + 4) (t + 1), 
p(t) tiene dos ceros distintos: — 1 y —4. Entonces, { er *, er 4t } es una base 
para el espacio solución, y entonces cualquier solución para la ecuación 
dada es de la forma 

y(0 = b^er* + b 2 e~ 4t para algunas constantes b^ y b 2 . 

Ejemplo 42. Encontremos todas las soluciones para la ecuación dife- 
rencial 

y" + 9y = 0. 

E1 polinomio auxiliar p(t) = f + 9 puede factorizarse como p(t) = 
(t — 3 i)(t + 3i) y por lo tanto tiene ceros distintos Ci = 3/, c 2 = —3/. 
Así, {c 5ií , e~ 3it ) es una base para el espacio solución. Una base de mucho 
mayor utilidad podría obtenerse aplicando el Ejercicio 7. Como 

cos 3t = -J (e3ií + y sen 2,1 = Yi ^ 3i< _ 
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se deduce que {cos 3t , sen 3 1) también es una base. Esta base tiene la 
ventaja sobre la original de que consiste de las conocidas funciones seno 
y coseno y no hace referencia al número imaginario i. 

Ahora considérese la ecuación diferencial ^ 

y n + 2/ + y — 0 , 

para la cual el polinomio auxiliar es p(t) = (t + l) 2 . Por el Teorema 
2.35, er* es una solución a la ecuación anterior. Por el corolario del 
Teorema 2.36 su espacio solución es bidimensional. Con el objeto de 
encontrar una base para el espacio solución, necesitamos encontrar una 
solución que sea linealmente independiente de er % . E1 lector podrá veri- 
ficar que te f cumple con esta condición y entonces {er\ ter 1 } es una base 
para el espacio solución. Este resultado puede generalizarse de la siguien- 
te manera. 

Teorema 2.38 . Sea p(t) = (t — c) n , donde c es un número complejo y n es 
un entero positivo, el polinomio auxiliar de una ecuación diferencial lineal 
homogénea con coeficientes constantes. El conjunto 

fì = (e ct , te ct , . .. , t n ^e ct } 

es una base para el espacio solución. 

demostración. Como el espacio solución es /r-dimensional necesitamos 
únicamente demostrar que /3 es linealmente independiente y que está en el 
espacio solución. Primero obsérvese que para cualquier entero positivo k 

(D - cl)(**e cí ) = kï~ x e ct + cïe ct - ct*e ct 
= ki*~'e ct . 


Por lo tanto, para k < n, 

(D - cl) n (^e cí ) = 0. 

Y se tiene que fi es un subconjunto del espacio solución. 

Ahora demostraremos que es linealmente independiente. Considérese 
cualquier combinación de p tal que 

b 1 t n ~ 1 e ct + + . . . + b n -ite ct + b n e ct = 0 (8) 

para algunos escalares b u . . . , b n . Dividiendo la ecuación (8) por e ct , 
obtenemos 

bj 71 - 1 + b 2 t+ 2 + . . . + bn-xt + b n = 0. (9) 

Por lo tanto, el lado izquierdo de la ecuación (9) debe ser la función poli- 
nomial cero, de donde concluimos que los coeficientes b u b 2 , . .. , b n son 
todos cero. Luego, fi es linealmente independiente y por lo tanto es una 
base para el espacio solución. ■ 
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Ejemplo 43. Dada la ecuación diferencial 

y<4) _ 4_y <3) + 6 y {2) — 4y (1) + y = 0, 

deseamos encontrar una base para el espacio de soluciones. Como su 
polinomio auxiliar es 

p(t) = r 4 - 4t 3 + ót 2 - 4t + 1 = (t - l) 4 , 

podemos concluir por el Teorema 2.38 que {e\ te\ t 2 e\ t 3 e*} es una base 
para el espacio de soluciones, de manera que cualquier solución a la ecua- 
ción dada es de la forma 

y(/) = b x e % + b 2 te* + b z fe f + bj 3 e l 

para algunos escalares b l9 b 2 , b 3 y b 4 . 

La situación más general (cuya demostración dejamos como ejercido) 
puede enunciarse de la siguiente manera. 

Teorema 2.39. Para una ecuación diferencial lineal con coeficientes constantes 
cuyo polinomio auxiliar es 

p(t) = (t - cO-^t - c 2 )*> ... (t - Ck) n S 

donde n^, n 2 , . .. , n k son enteros positivos y Ci, c 2 , . . . , <* son números 
complejos distintos , el siguiente conjunto es una base para el espacio solu- 
ción de la ecuación: 


{e Cit , te Cit , . .. , t^e® 11 , ... , e Ckt , te Ckt , . .. , t nk ~ 1 e Ckt }. 

Ejemplo 44. Considérese la ecuación diferencial 

y<3) - 4y <2) + 5y (1> - 2y = 0 . 

Encontraremos una base para su espacio solución. Como el polinomio au- 
xiliar p(t) puede factorizarse como 

p(t) = t 3 - 4P + 5/ - 2 = (/ - 1) 2 (/ - 2), 

concluimos que el espacio solución de la ecuación diferencial anterior tiene 
como base 

{e\ te\ e 2 *}. 

Por ello cualquier solución a la ecuación dada es de la forma 
y(t) = bie* + b 2 te l + b s e 2t 


para algunos escalares b u b 2 y b 3 . 
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EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) E1 conjunto de soluciones de una ecuación diferencial Jjneal homogé- 
nea de orden n con coeficientes constantes es un subespacio n-dimen- 
sional de C°. 

(b) E1 espacio de soluciones de una ecuación diferencial lineal homogénea 
es el espacio nulo de un operador diferencial. 

(c) E1 polinomio auxiliar de una ecuación diferencial lineal homogénea 
con coeficientes constantes es una solución a la ecuación diferencial. 

(d) Cualquier solución a una ecuación diferencial lineal homogénea con 
coeficientes constantes cs de la forma ae ct o af*e ct donde a y c son 
números complejos y k es un entero positivo. 

(e) Cualquier combinación lineal de soluciones a una ecuación diferen- 
cial lineal homogénea con coeficientes constantes es también una 
solución a la ecuación dada. 

(f) Para cualquier ecuación diferencial lineal homogénea con coeficien- 
tes constantes que tenga un polinomio auxiliar p(t ), si c u c 2 , ... , 
son las distintas raíces de p(t), entonces {e Cií , e . .. , e Ckt } es una 
base para el espacio de soluciones de la ecuación diferencial dada. 

(g) Dado cualquier polinomio p(t) €P(C), existe una ecuación diferen- 
cial lineal homogénea con coeficientes constantes cuyo polinomio au- 
xiliar es p(t). 

2. Para cada uno de los incisos siguientes, determinar si el enunciado es verda- 
dero o falso. Justificar la respuesta con una demostración o en su caso con 
un contraejemplo. 

(a) Cualquier subespacio dimensionalmente finito de C°° es el espacio 
solución de una ecuación diferencial lineal homogénea con coeficien- 
tes constantes. 

(b) Existe una ecuación diferencial lineal homogénea con coeficientes cons- 
tantes cuyo espacio solución tiene como base a {/, f 2 }. 

(c) Para cualquier ecuación diferencial lineal homogénea con coeficientes 
constantes, si x es una solución, también lo será su derivada x'. 

Dados dos polinomios p(t) y g(t) en P(C), si x ÇN(p(D)) yy£N(?(D)) 
entonces 

(d) x + yeN(p(D)q(D)). 

(e) xy£N(p(D)q(D)). 

3. Encontrar bases para los espacios de soluciones de las siguientes ecuaciones 
diferenciales. 
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(a) y" + 2/ + y = 0 

(b) /" = / 

(c) y (t) - 2y w + y = 0 

(d) y" +2y' + y = 0 

(e) y <3) - y ,2) + 3y (1) + 5y = 0 

4. Encontrar bases para los siguientes subespacios de C®. 

(a) N(D 2 — D— I) 

(b) N(D 3 - 3D 2 + 3D - I) 

(c) N(D 3 + 6D 2 + 8D) 

5. Demostrar que C x es un subespacio de 7(R, C). 

6. (a) Probar que D: C® —> C® es una transformación lineal. 

(b) Probar que cualquier operador diferencial es una transformación li- 
neal en C®. 

7. Demostrar que si {x, y) es una base para un espacio vectorial sobre C, 
entonces también lo es 

{' T {x + y) > lî (x ~ y) }’ 

8. Dada una ecuación diferencial lineal homogénea con coeficientes constantes 
de segundo orden, supóngase que el polinomio auxiliar tiene raíces complejas 
conjugadas a + ib y a — ib, donde a, b £R. Demostrar que { e M cos bt, 
& 1 * sen bt) es una base para el espacio solución. 

9. Dada una colección de transformaciones lineales conmutativas por parejas 
(U^, U 2 , . .. , U w } de un espacio vectorial V (es decir, transformaciones tales 
que U i U j = U ; U| para toda i, /), probar que para cualquier ï = 1, 2, . .. , n. 

N(Ui) Ç N(U,U 2 ...U n ). 

10. Demostrar el Teorema 2.37 y su corolario. Sugerencia: Suponer que 

brt^* 4- b 2 e c2Í 4* . . . + b— 0 (donde los c * son distintos). 

Para demostrar que los bi son cero, aplicar inducción matemática sobre n. 
Verificar el teorema para n— 1. Suponiendo que el teorema es cierto para 
cualquier n — 1 funciones, aplicar el operador D — c„l a ambos lados de 
la ecuación anterior para establecer el teorema para n diferentes funciones 
exponenciales. 

11. Demostrar el Teorema 2.39. Sugerencia: Primero verifíquese que la base 
supuesta se encuentra en el espacio solución. Luego verifíquese que este 
conjunto es linealmente independiente por inducción matemática sobre k. 
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E1 caso k = 1 es el Teorema 2.38. Suponiendo que el teorema se cumple 
para k - 1 d diferentes, aplíquese el operador (D — c*l) n ‘ a cualquier 
combinación lineal de la base supuesta que sea igual a cero. 

12. Sea V el espacio de soluciones de una ecuación diferencial lineal homogé- 
nea de orden n con coeficientes constantes, cuyo polinomio auxiliar es p(t). 
Demostrar que si p(t) — g(t)h(t), donde g(t) y h(t) son polinomios de 
grado positivo, entonces 

N(h(D)) = R(g(D v )) — g(D)(V), 

donde D v : V —> V está definida mediante D v (ar) = jc' para x £ V. Sugeren~ 
cia: Demostrar primero que g( D)(V) Ç N(/i(D)). Entonces, probar que 
los dos espacios tienen la misma dimensión finita. 

13. Una ecuación diferencial 

y< n > + a^y^ + . . . + ^yí 1 ) + a^y = x 

se denomina ecuacion diferencial lineal no homogénea con coeficientes cons- 
tantes si los coeficientes a^ son constantes y el lado derecho de la ecuación, 
x , es una función que no es idénticamente nula. 

(a) Demostrar que para cualquier x£C 30 existe una y £C° tal que y es 
una solución para la ecuación anterior. Sugerencia: Utilizar el Le- 
ma 1 del Teorema 2.36 para demostrar que si 

P(t) = r + (u- x r-' + . .. + a x t + a 09 

entonces p(D): C 00 —» C 00 es sobreyectiva. 

(b) Sea V el espacio de soluciones para la ecuación lineal homogénea 

y (n) + # n - 1 y (n ~ 1) + . . . + a,y (1) + a 0 y = 0. 

Demostrar que si z es cualquier solución a la ecuación diferencial li- 
neal no homogénea anterior, entonces el conjunto de todas Ias solu- 
ciones a la ecuación diferencial lineal no hbmogénea es 

(z + y: yCV). 

14. Dada cualquier ecuación diferencial lineal no homogénea de orden n con 
coeficientes constantes, demostrar que para cualquier solución x y cualquier 
t 0 £R si jc(í 0 ) — x'(t 0 ) = . .. = x {n - x) (t 0 ) = 0, entonces jc = 0 (la fun- 
ción cero). Sugerencia: Emplear inducción matemática sobre n. Primero 
demostrar la conclusión para el caso n = 1. Luego, supóngase que es cierto 
para ecuaciones de orden n — 1 y considérese una ecuación de orden n 
con polinomio auxiliar p(t). Descomponer p(t) como p(t) = q(t)(t - c) 
para algún número complejo c y un polinomio q(t) de grado n - 1. Sea 
z — q(D)x. Demostrar que z(t 0 ) — 0 y que z es una solución para la 
ecuación y' — cy = 0. Concluir que z ~ 0. Ahora aplíquese la hipótesis de 
inducción. 
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15. 


Sea V el espacio solución de una ecuación diferencial lineal homogénea de 
orden n con coeficientes constantes. Fijar t 0 £R y definir un mapeo <I>: 
V 1 —> C n por 


*(*) = 


x(t 0 ) 

x'(t 0 ) 


para cada x e V. 


* 


\x< n+ì \t 0 )l 


(a) Demostrar que $ es lineal y que su espacio nulo es trivial. Deducir 
que <ï> es un isomorfismo. Sugerencia: Usar el Ejercicio 14. 

(b) Demostrar lo siguiente: Para cualquier ecuación diferencial lineal ho- 
mogénea de orden n con coeficientes constantes, cualquier t 0 £ R y 
cualesquiera números complejos c 0 , c u . .. , c n -i (no necesariamente 
distintos), existe exactamente una solución, x, a la ecuación diferen- 
cial dada tal que x ik) (t 0 ) = c k para k = 0, 1 , . .. , n — 1 . 


16. Movimiento pendular. Es bien sabido que el movimiento de un péndulo se 
puede representar por la ecuación diferencial 

6" + Ỳ = 0, 

donde 6(t) es el ángulo en radianes que el péndulo forma con una línea 
vertical en el tiempo t (ver Fig. 2.6) interpretado de tal modo que 6 sea 
positivo si el péndulo está a la derecha y negativo si el péndulo está a la 
izquierda de la línea vertical, desde el punto de vista del lector. En este 



figura 2.6 


caso / es la longitud del péndulo y g es la magnitud de la aceleración debi- 
da a la gravedad. La variable / y las constantes / y g deben estar expresadas 
en unidades compatibles, por ejemplo, t en segundos, / en metros y g en 
metros por segundo por segundo. 

(a) Expresar una solución arbitraria a esta ecuación como una combina- 
ción lineal de dos funciones reales fijas. 
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(b) Encontrar la solución única dc la ecuación que satisface las condi- 
ciones 

6(0) - 0 O > 0 y $'(0) = 0. 


(EI significado de lo anterior es que en un tiempo / = 0 el péndulo está 
desplazado de la posición vertical 6 0 radianes y tiene una velocidad cero.) 

(c) Demostrar que al péndulo le toma 2ir W — unidades de tiempo 


para completar un recorrido completo de ida y vuelta. (Este lapso 
se denomina perîodo del péndulo.) 


17. Movimiento Periódico de un Resorte con Amortiguamiento . A1 principio 
de esta sección discutimos el movimiento de xm resorte que oscila bajo la 
suposiciófn de que la única fuerza que actuaba sobre el resorte era la fuerza 
debida a la tensión del mismo. Encontramos en este caso que la ecuación 
(3) describía el movimiento del resorte. 

(a) Encontrar la forma general de todas las soluciones de la ecuación (3). 

Si analizamos el comportamiento de la solución general del inciso (a), ve- 
mos que la solución es una función periódica. Por tanto la ecuación (3) 
indica que el resorte nunca cesará de oscilar. Sin embargo, sabemos por ex- 
periencia, que la amplitud de la oscilación decrece hasta que finalmente 
el movimiento cesa. La razón por la cual la solución del incisò (a) no expli- 
ca este comportamiento es que hemos ignorado el efecto de la fricción sobre 
el peso en movimiento. A bajas velocidades, tales como la que se está 
considerando, la resistencia del aire proporciona un ejemplo de amortigua- 
miento viscoso —la resistencia es proporcional a la velocidad del peso en 
movimiento pero en dirección opuesta. Para hacer una corrección a causa 
de la resistencia del aire, debemos aiiadir a la ecuación (2) el término —ry'. 
La constante r > 0 depende del medio en el cual ocurre el movimiento 
(en este caso el aire), y el término —ry' tiene un signo negativo debido a 
que la resistencia tiene siempre sentido opuesto al del movimiento. Luego 
entonces, la ecuación diferencial del movimiento es my" = —ry' — ky; es 
decir, 

my" + ry' + ky = 0. 

(b) Encontrar la solución general de esta ecuación. 

(c) Encontrar la solución única del inciso (b) que satisface las condi- 
ciones iniciales y(0) = 0 y y'(0) = v 0 . 

(d) Para y(t) del inciso (c), demostrar que la amplitud de la oscilación 
decrece hasta llegar a cero; o sea, demostrar que 

lim y(0 = 0. 

18. A1 principio de esta sección se enunció que es útil considerar las solucio- 
nes de las ecuaciones diferenciales como funciones complejas de variable 
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real, aun cuando las soluciones que para nosotros tienen significado en el 
sentido físico son funciones reales. Justificar este punto de vista. 

% 

19. E1 siguiente conjunto de ejercicios no implican el uso de álgebra lineal; 
los enunciamos sólo para completar un poco más el tema. 

(a) Demostrar el Teorema 2.31. Sugerencia: Utilizar inducción matemá- 
tica sobre el número de derivadas que tiene una solución. 

(b) Demostrar (i) e° +d = e°e?. 

(ii) er c = — para c, á£C. 
e° 

(c) Demostrar el Teorema 2.33. 

(d) Verificar la regla del producto de la diferenciación para funciones 
complejas de variable real: Para cualquier par de funciones diferen- 
ciables jc y y en ?(/?, C)el producto xy es diferenciable y 

( xy )' = x'y + xy'. 

Sugerencia; Encontrar las partes reales e imaginarias de xy en tér- 
minos de las x y las de y, luego proceder con la diferenciación. 

(e) Demostrar que si rf J(R, C) y x' = 0, entonces x es una función 
constante. 
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Oapítulo 3 


Operaciones elementales 
en matrices y sistemas de 
ecuaciones linealss 


Este capítulo está dedicado al logro de dos objetivos relacionados entre 
sí: 

1. E1 estudio de algunas operaciones “que conservan el rango” en 
las matrices. 

2. La aplicación de estas operaciones y de la teoría de las transfor- 
maciones lineales a la solución de sistemas de ecuaciones lineales. 

Como una consecuencia del primer objetivo obtendremos un método sen- 
cillo para calcular el rango de una transformación Iineal entre espacios 
vectoriales dimensionalmente finitos, aplicando las operaciones que con- 
servan el rango a una matriz que representa dicha transformación. 

La solución de sistemas de ecuaciones lineales es probablemente la 
aplicación más importante del álgebra lineal. E1 conocido método de eli- 
minación para resolver sistemas de ecuaciones lineales, que fue discutido 
en la Sección 1.4, implica la eliminación de variables de manera que se 
pueda obtener un sistema más sencillo. Esta técnica por medio de la cual 
se eliminan las variables utiliza tres tipos de operaciones: 

1. Intercambio de dos ecuaciones cualesquiera del sistema. 

2. Multiplicación de cualquier ecuación del sistema por una constan- 
te no nula. 

3. Suma de un múltiplo de una ecuación a otra ecuación. 

Veremos en la Sección 3.3 que un sistema de ecuaciones lineales puede 
ser expresado como una ecuación matricial sencilla. En esta representación 
del sistema las tres operaciones mencionadas anteriormente son las “ope- 
raciones elementales con los renglones” en las matrices. Estas operacio- 
nes proporcionarán un método de cálculo conveniente para determinar 
todas las soluciones de un sistema de ecuaciones lineales. 






140 


Operaciones en matrices y sistemas de ecuaciones lineales 


3.1 OPERACIONES ELEMENTALES EN MATRICES 
Y MATRICES ELEMENTALES 


En esta sección definiremos las operaciones elementales para matrices que 
serán empleadas a lo largo de este capítulo. En las secciones subsecuentes 
estas operaciones serán utilizadas para obtener métodos sencillos de cálcu- 
lo, para determinar el rango de una transformación lineal y las soluciones 
de un sistema de ecuaciones lineales. Existen dos tipos de operaciones ma- 
triciales elementales —operaciones sobre los renglones y operaciones sobre 
las columnas. Como veremos a continuación, las operaciones con los 
renglones son de mayor utilidad. Estas operaciones surgen de las tres ope- 
raciones que se pueden emplear para eliminar variables en un sistema de 
ecuaciones lineales. 

Sea A una matriz de m x n en un campo F . Recuérdese que A puede 
considerarse como un arreglo de m renglones, 


ííì 


A = 



o como un arreglo de n columnas, A — (A 1 , A 2 , . . . , A n ). 


Definiciones. Sea A una rnatriz de m x n, como la anterior. Cualquiera de las 
tres operaciones siguientes sobre los renglones [columnas] de A se deno- 
mina operación elemental sobre los renglones [columnas]. 

(a) Intercambio de dos renglones [columnas] cualesquiera de A. 

(b) Multiplicación de cualquier renglón [columna] de A por una 
constante no nula. 

(c) Suma de cualquier múltiplo constante de un rengión [columna] 
de A a otro renglón [columna]. 

Cualquiera de las tres operaciones anteriores se denominará operaciór 
elemental. 

Las operaciones elementales serán tipo 1, tipo 2 o tipo 3, dependiendo de 
si se trata de (a), (b) o (c). 


Ejemplo 1. Sea 


/1 2 3 4' 

A=Ì2 1 -1 3 

\4 0 12, 
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E1 intercambio de A 2 , el segundo renglón de A, con A u el primer 
renglón de A, es un ejemplo de una operación elemental de tipo 1 sobre 
los renglones. La matriz resultante es 

/2 1 -1 3\ 

B = ll 2 3 4 ■ 

\4 0 12/ 

Así también, la multiplicación de A 2 , la segunda columna de A, por 
3 es un ejemplo de una operación elemental sobre las columnas del tipo 2. 
La matriz resultante es 

/1 6 3 4\ 

C= 2 3 -I 3 • 

\4 0 12/ 

Por último, la suma de A u el primer renglón de A, de cuatro veces 
A 3 , el tercer renglón de A, es un ejemplo de una operación elemental con 
renglones del tipo 3. La matriz resultante es 

/17 2 7 12\ 

£>=21-1 3 • 

\ 4 0 12/ 

Definición. Una matriz elemental de n x n es una matrìz obtenida al realizar 
una operación elemental en I„. Se dice que la matriz es del tipo 1, 2, o 3 
dependiertdo de que la operación realizada en I„ haya sido del tipo 1, 
2 o 3, respectivamente. 


Por ejemplo, el intercambio de los dos primeros renglones de / 3 pro- 
duce la matriz elemental 


fi 



Nótese que E también se puede obtener mediante el intercambio de las 
dos primeras columnas de / 3 . De hecho, cualquier matriz elemental puede 
ser obtenida al menos de dos maneras —ya sea realizando una operación 
elemental con renglones en /„ o realizando una operación elemental con 
columnas en / n . De igual manera 




es una matriz elemental, ya que puede obtenerse a partir de / 3 mediante 
una operación elemental con columnas del tipo 3 (anadiendo —2 veces 
la primera columna de / 3 a la tercera) o mediante tma operación elemen- 
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tal con renglones del tipo 3 (anadiendo —2 veces el tercer renglón al 
primero). 

Nuestro primer teorema muestra que realizar una operación elemental 
en una matriz es equivalente a multiplicar la matriz por una matriz ele- 
mental. 

Teorema 3.1. Sea A£M mxn (F), y supóngase que B se obîiene a partir de A 
al realizar una operación elemental con renglones [columnas]. Entonces 
existirá una matriz elemental E de m x m [n x n] tal que B = EA[B = 
AE]. De hecho, E se obtiene al realizar la operación correspondiente con 
renglones [columnas] en I m [I n ]. Recíprocamente, si E es una matriz elemen- 
tal de m x m[n x n], entonces EA[AE] es una matriz que se puede obte - 
ner realizando una operación elemental con renglones [columnas] en A. 

Antes de considerar una demostración, consideraremos primero un 
ejemplo para ilustrar el significado del teorema. 

Ejemplo 2. Considérese la matriz B del Ejemplo 1. Esta matriz fue ob- 
tenida a partir de A (en el Ejemplo 1) intercambiando los dos primeros 
renglones de A. Realizando esta misma operación en I? obtenemos la 
matriz elemental 

/ /° 1 °\ 

E = i\ 0 0 . 

\0 0 1/ 

Nótese que EA = B. 

En la segunda parte del Ejemplo 1, C se obtiene a partir de A multi- 
plicando la segunda columna de A por 3. Realizando esta misma operación 
en / 4 , obtenemos la matriz elemental 

/1 0 0 0\ 

0 3 0 0 
~ 0 0 1 0 
\0 0 0 1 

Obsérvese que AE = C. 

demostración del teorema 3.1. Supóngase que B se obtiene a partir 
de A mediante una operación elemental. Debemos considerar seis casos, 
una por cada tipo de operación con renglones y una por cada tipo de 
operación con columnas. 

Supóngase que B se obtiene intercambiando los renglones p y q de 
A(p < q) mediante una operación elemental del tipo 1. Entonces 

(a) Bij = A u para i ^ p e i q y y j .= 1, 2, . . . , n. 

(b) B pj = A (Jj para j = 1, 2, . . . , n. 

(c) B (J j = A P j para / = 1, 2, . . . , n. 
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Sea E la matriz elemental demx»i obtenida a partir de / m intercambian- 
do los renglones p y q de / m . Entonces para i=/= p e i =/= q y para toda 
/0 < / <m): 

J Eij = 0 si i =/= j 

=1 si i = /. 

Para i = p, 

J E pj = 0 si / =/= q 
\ E„ = 1 . 

Para i = q, 

Eqj = 0 si j =/= p 
E m = 1. 

Puesto que 

m 

(EA)ij = 2 ErjçAjçj, 

/c = i 

para toda / se tiene que 

(EA) ij 
(EA) pj 
(EA) q j 

De aquí que 

= (E/4)ì ; para toda / y toda /. 

Esto establece el caso 1. 

Si 5 se obtiene a partir de A mediante una operación elemental con 
renglones del tipo 2 o 3, entonces la demostración es semejante y podrá 
realizarse como ejercicio. 

Ahora supóngase que B se obtiene a partir de A realizando una ope- 
ración elemental con las columnas de A. Entonces, por el Ejercicio 5, B* 
se puede obtener a partir de A * mediante las correspondientes operaciones 
elementales con renglones de A. Entonces, las partes anteriores de la de- 
mostración muestran que la matriz elemental M de n x n obtenida al 
realizar el mismo tipo de operación con renglones en I n tiene la propiedad 
de que B f = MAK Obsérvese que E = M l es una matriz elemental que 
puede obtenerse realizando las operaciones elementales correspondientes 
con columnas en I n . Entonces, B = (B^Y = (MA*)* = AM l = AE , esta- 
bleciendo el mismo resultado para operaciones con columnas. 

La demostración de la proposición recíproca se deja como ejercicio. ■ 

Es un hecho de gran utilidad el que la inversa de una matriz elemental 
es también una matriz elemental. 


— EuAij — Aij si i^p o q, 

EpqAgj — A q j , 

EqpApj Apj. 
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Teorema 3.2. Las maírices elementales son invertibles y la irtversa de una 
matriz elemental es una matriz elemental del mismo tipo. 

demostración . En vista del hecho de que cualquier matriz elemental de 
n x n puede obtenerse mediante operaciones elementales con renglones 
en / w , sólo necesitamos considerar tres casos —uno por cada tipo de ope- 
ración. 

Sea E una matriz elemental de n x n. 

Caso 1. Supóngase que E se obtiene intercambiando los renglones p y 
q de I n (p q ), una operación elemental del tipo 1. Resulta fácil verificar 
que E 2 = l n . Por lo tanto, E es invertible y, de hecho, E = E 1 . Esto esta- 
blece el primer caso. 

Caso 2. Supóngase que E se obtiene multiplicando el renglón p de / w 
por una constante c no nula, una operación elemental del tipo 2. Como 
c^O, c tiene un inverso multiplicativo. Sea E la matriz elemental obte- 
nida a partir de I n multiplicando el renglón p de / n por c~ x . Puede demos- 
trarse fácilmente que EE — EE = I n . Esto establece el segundo caso. 

Caso 3. Supóngase que E se obtiene sumando al renglón p de / w c veces 
el renglón q de / w , donde p =£q y c es cualquier escalar. Entonces E puede 
obtenerse a partir de I n mediante una operación elemental del tipo 3. 

Obsérvese que / w puede obtenerse a partir de E mediante una opera- 
ción elemental con renglones del tipo 3 —a saber, sumando al renglón p 
de E - c veces el renglón q de E. Por el Teorema 3.1 se tiene que existe 
una matriz elemental E (del tipo 3) tal que EE = / w , y por el Ejercicio 8 
de la Sección 2.4 E es invertible y E~ x = E. ■ 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Una matriz elemental siempre es cuadrada. 

(b) Los únicos elementos de una matriz elemental son ceros y unos. 

(c) La matriz identidad de n x n es una matriz elemental. 

(d) E1 producto de dos matrices elementales de n x n es una matriz 
elemental. 

(e) La matriz inversa de una matriz elemental es una matriz elemental. 

(f) La suma de dos matrices elementales de n x n es una matriz ele- 
mentaî. 

(g) La transpuesta de una matriz elemental es una matriz elemental. 

(h) Si B es una matriz que se puede obtener realizando una operación 
elemental con renglones en una matriz A, entonces B también puede 
obtenerse realizando una operación elemental con columnas en A. 
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(i) Si 2? es una matriz que se puede obtener realizando una operación 
elemental con renglones en una matriz A, entonces A se puede obte- 
ner realizando una operación elemental con renglones en B. 

2 . Sean 

/1 2 3\ /1 0 3\ /1 0 3\ 

A= (\ -í \) b H: :> s c= v? ~-i ~ì) 

Encontrar una operación elemental que permita transformar a A en B y 
otra que transforme a B en C. Por medio de varias operaciones elementales 
adicionales transformar a C en / 3 . 

3. Demostrar la aseveración hecha en la página 141. Una matriz elemental de 
n x n puede obtenerse al menos de dos maneras —ya sea realizando una 
operación elemental con renglones en I n o realizando una operación ele- 
mental con columnas en /«. 

4 . Demostrar que E es una matriz elemental si y sólo si E f lo es. 

5. Sea A una matriz de m x n. Demostrar que si B puede obtenerse a partir 
de A mediante una operación elemental con renglones [columnas], enton- 
ces B l puede obtenerse a partir de A l mediante la operación elemental 
correspondiente con renglones [columnas]. 

6. Completar la demostración del Teorema 3.1. 

7. Verificar la aseveración hecha en el Caso 1 de la demostración del Teore- 
ma 3.2: Si E es una matriz elemental d e n x n del tipo 1, entonces E 2 = I n . 

8. Verificar que para la matriz Ê definida en la demostración del Caso 2 deî 
Teorema 3.2 EE — EE = I n . 

9. Demostrar que cualquier operación elemental con renglones [columnas] del 
tipo 1 puede obtenerse mediante una sucesión de tres operaciones elemen- 
tales con renglones [columnas] del tipo 3 seguida por una operación ele- 
mental con renglones [columnas] del tipo 2. 

10. Demostrar que cualquier operación con renglones [columnas] del tipo 2 pue- 
de obtenerse dividiendo algún renglón [columna] por un escalar no nulo. 

11. Demostrar que cualquier operación elemental con renglones [columnas] del 
tipo 3 puede obtenerse resîando un múltiplo de algún renglón [columna] 
de otro renglón [columna]. 
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3.2 EL RANGO DE UNA MATRIZ Y LA INVERSA DE UNA MATRIZ 

En esta sección definiremos el rango de una matriz, y utilizaremos enton- 
ces las operaciones elementales para calcular el rango de una matriz o 
de una transformación lineal. La sección concluirá con un procedimiento 
para calcular la inversa de una matriz invertible. 

Definición. Sì A ÇM mxn (F), definimos el rango de A, que escribiremos ran- 
go(A), como el rango de la transformación lineal L A : F n ^ F m . 

Un gran número de resultados sobre el rango de las matrices se deriva 
de inmediato a partir de los hechos correspondientes sobre las transfor- 
maciones lineales. Un resultado importante de este tipo, que se deriva del 
Teorema 2.20 y del Corolario 2 del Teorema 2.21, es que una matriz de 
n x n t s invertible si y sólo si su rango es n. 

Nos gustaría que la definición anterior satisficiera la condición de que 
el rango de una transformación lineal fuese igual al rango de cualquier 
matriz que represente dicha transformación. Nuestro primer teorema mues- 
tra que, de hecho, esta condición se satisface. 

Teorema 3.3. Sea T: V W una transformación lineal entre espacios vecto- 
riales dimensionalmente finitos y sean /3 y y bases ordenadas para V y 
W, respectivamente. Entonces , rango(T) =rango([T]p. 

demostración. Esta es sólo una manera de reenunciar el Ejercicio 18 
de la Sección 2.4. ■ 

Corolario 1. Sea A una matriz de m x n.. Si P y Q son respectivamente ma- 
trices invertibles de m x m y n x n, entonces rango( PAQ) = rango(A). 
En particular rango( PA) = rango(AQ) = rango(A). 

demostración. Sea B = PAQ. En virtud del Ejercicio 12 de la Sección 
2.5, existen espacios vectoriales V y W, bases /?, J3' para V y y, y ' para 
W y una transformación lineal T: V=>W tal que A — [T] 7 y B = [T] 7 '. 
Entonces por el Teorema 3.3 

rango(P^<2) = rango(fi) = rango(T) = mngo(A). ■ 

Corolario 2. Las operaciones elementales con renglones y columnas en una 
matriz conservan el rango. 

demostración. Si la matriz B se obtiene a partir de la matriz A me- 
diante una operación elemental con renglones, entonces existe una matriz 
elemental E tal que B ~ EA. De acuerdo con el Teorema 3.2, E es 
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invertible y por tanto rango(fl) = rango(/í) por el Corolario 1. Por lo 
tanto, las operaciones elementales con renglones conservan el rango. La 
demostración de que las operaciones elementales con columnas no alteran 
el rango se deja como ejercicio. ■ 

E1 Teorema 3.3 relaciona íntimamente el rango de una transformación 
lineal con el rango de una matriz. Como las matrices son herramientas 
útiles para estudiar las transformaciones lineales, es importante desarrollar 
un método para calcular el rango de una matriz. Esta será nuestra siguien- 
te tarea. 


Teorema 3.4. El rango de cualquier matriz es igual al máximo número de co- 
lumnas linealmente independientes de dicha matriz; esto es, el rango de 
una matriz es la dimensión del subespacio generado por las columnas 
de dicha matriz. 


demostración. Para toda A ÇM^^F), 

rango(^) = rango(L) = dim(R(L t )). 

Sea /3 = {e u e 2 , . .. , e n }, la base ordenada estándar para F n . Entonces /3 
genera a F n y entonces 

R(La) = L{l A {e x ), l A (e 2 ), . . . , L A (e n )}. 

Pero hemos visto que L A (e f ) — A’, la columna j-é sima de A. Por lo tanto 

R(i Á ) =L{A\A 2 , ... ,A»}. 

Entonces 

rango(^) = dim(R(L A )) = dim (L{A\ A 2 , . . . , A n }). ■ 


Ejemplo 3. Sea 



Obsérvese que la primera y la segunda columnas de A son linealmente 
independientes y que la tercera columna es una combinación lineal de las 
dos primeras. Entonces 


rango(A) = dim 





— 2 . 


Para calcular el rango de una matriz A, a menudo es útil posponer 
el empleo del Teorema 3.4 hasta que A se haya modificado adecuada- 
mente por medio de operaciones elementales con renglones y columnas de 
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tal manera que el número de columnas linealmente independientes sea 
evidente. E1 Corolario 2 del Teorema 3.3 garantiza que el rango de la 
matriz modificada es el mismo que el rango de A. Una de esias modifica- 
ciones de A se puede obtener mediante el uso de operaciones elementales 
con columnas y renglones hasta introducir elementos nulos. E1 ejemplo 
siguicnte ilustra este procedimiento. 

Ejemplo 4. Sea 

/' 2 '\ 

A= 1 0 3 • 

\1 1 2 / 


Si restamos el primer renglón de A de los renglones 2 y 3 (operaciones 
elementales tipo 3 con renglones), se tiene como resultado 



Si ahora restamos dos veces la primera columna de la segunda y la prime- 
ra columna de la tercera (operaciones elementales tipo 3 con columnas) 
obtenemos 



Es ahora evidente que el número máximo de columnas linealmente inde- 
pendientes de esta matriz es 2. Por lo tanto, el rango de A es 2. 


E1 siguiente teorema utiliza este proceso de modificación de una matriz 
por medio de operaciones elementales con renglones y columnas para 
transformarla a una forma particularmente simple. La fuerza de este teore- 
ma se puede ver en sus corolarios. 


Teorema 3.5. Sea A una matriz de m x n de rango r. Entonces r < m, r < n, 
y por medio de un número finito de operaciones elementales con renglo - 
nes y columnás A se puede transformar en una matriz D tal que 


(a) 

D u = 0 

para 

i ^ j> 

(b) 

Dii = 1 

para 

i < r, 

(c) 

Dn = 0 

para 

i > r. 


E1 teorema anterior y sus corolarios son muy importantes. Su demos- 
tración, aunque fácil de entender, es bastante tediosa. Como ayuda para 
seguir la demostración consideraremos primero un ejemplo. 
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Ejemplo 5. Considérese la matriz 

/0 2 4 2 2 

^ _ 4 4 4 80 

~ 8 2 0 10 2 

\6 3 2 9 1 

Por medio de una sucesión de operaciones elementales con renglones y 
columnas transformaremos a A en una matriz D tal como lo establece el 
Teorema 3.5. Escribiremos muchas de las matrices intermedias, pero en 
algunas ocasiones transformaremos una matriz a partir de la anterior me- 
diante varias operaciones elementales simultáneas. E1 número sobre la 
flecha indicará cuántas operaciones se han involucrado; trátese de iden- 
tificar la naturaleza de cada operación (si se hizo sobre un renglón o 
sobre una columna y el tipo de operación). 

/0 2 4 2 2\ /4 4 4 8 0\ /1 1 1 2 0\ 

444 80 ,024 22 ,024 22 2 

820 10 2 * 8 2 0 10 2 * 8 2 0 10 2 * 

3 2 9 1/ 3 2 9 1/ 3 2 9 1/ 

1 1 2 0\ /1 0 0 0 0\ 

2 4 2 2 3 0 2 4 22, 

6 - 8-6 2 0 -6 -8 -6 2 * 

3 -4 -3 1/ \0 -3 -4 -3 1/ 

/1 0 0 0 0\ 

0 12 11 
0 -6 -8 -6 2 

\0 -3 -4 -3 l/ 

/1 0 0 0 0\ /1 0 0 0 0\ /1 0 0 0 0 

01000 , 01000 , 01000 
0 0 1 0 2 ^ 0 0 1 0 2 * 0 0 10 0 
\o 0 2 0 4 / \o 0 0 0 0 / \o 0 0 0 0 

En virtud del Corolario 2 del Teorema 3.3, rango (A) = rango(D), pero 
es evidente que rango(D) = 3; así rango(/t) = 3. Nótese que las dos 
primeras operaciones elementales dan como resultado un 1 en la posición 
1, 1 y las siguientes operaciones (tipo 3) dan como resultado ceros, en 
todas las posiciones del primer renglón y primera columna a excepción de 
la posición 1, 1. Las operaciones elementales subsecuentes no producen 
cambios en el primer renglón ni en la primera columna. Con este ejem- 
plo en mente procederemos a la demostración. 



/10 0 
2 0 1 2 
”^004 

\o 0 2 


0 0\ /1 

11 3 0 

0 8 * 0 

0 4/ \o 


0 0 0 0\ 
10 0 0 , 
0 4 0 8 _ 
0 2 0 4 / 
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demostración del teorema 3.5. Si A es uiia matriz nula, r = 0 por 
el Ejercicio 3. En este caso se concluye que D = A. 

Ahora, supóngase que A ^ O y r = rango (A); entonces r > 0. La 
demostración se hará por inducción matemática sobre m, el número de 
renglones de A. 

Supóngase que m = 1. Por medio de a lo más una operación con 
columnas del tipo 1 y una operación con columnas del tipo 2, A puede 
ser transformada en una matriz con un 1 en la posición 1, 1, y por medio 
de a lo más n — 1 operaciones con columnas del tipo 3, esta matriz puede 
ser transformada a su vez en la matriz 

D = (1, 0, 0, ... , 0). 

Nótese que existe un máximo de una columna linealmente independien- 
te en D. Por lo tanto rango(D) — rango (A) = 1 de acuerdo con el Coro- 
lario 2 del Teorema 3.3 y el Teorema 3.4. Por lo tanto, el teorema queda 
establecido para m— 1. 

Ahora supóngase que el teorema se cumple para cualquier matriz con 
un máximo de m — 1 renglones (para algún m > 1). Demostraremos que 
el teorema se cumple para cualquier matriz con m renglones. 

Supóngase que A es cualquier matriz de m x n. Si n = 1, el Teorema 
3.5 se demuestra de una manera análoga que para m = 1. (Véase el 
Ejercicio 10.) 

Supondremos que n > 1. Como A ^ O, A x j 0 para algún i, j. Por 
medio de a lo más una operación con renglones y una operación con 
columnas (ambas del tipo 1) se puede colocar un elemento no nulo en la 
posición 1, 1 (tal como se hizo en el Ejemplo 5). Por medio de a lo más 
una operación adicional del tipo 2 podemos asegurar un 1 en la posición 
1, 1. (Véase la segunda operación en el Ejemplo 5.) Por medio de un 
máximo de m — 1 operaciones con renglones del tipo 3 y n — 1 opera- 
ciones con columnas del tipo 3 podemos eliminar a todos los elementos 
no nulos del primer renglón y la primera columna, con excepción del 1 
en la posición 1, 1. (En el Ejemplo 5 utilizamos dos operaciones con 
renglones y tres operaciones con columnas para poder alcanzar este estado.) 

Por tanto, con un número finito de operaciones elementales, A puede 
transformarse en una matriz 



0 ••• ( 

ò’ 



B' 
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donde B f es una matriz de (m — 1) x (n — 1). En el Ejemplo 5, 

/ 2 4 2 2\ 

B'= -6 -8 -6 2 • 

\—3 -4 -3 1/ 

Por el Ejercicio 11, B' tiene un rango una unidad menor que el de B. 
Como rango(^) = rango(B) — r, rango(fí') = r — 1. De acuerdo con 
la hipótesis de inducción r — 1 < n — 1 yr — l<m~l. Por lo tanto, 
r < m y r < n. 

También por la hipótesis de inducción, B f puede transformarse por 
medio de un número finito de operaciones elementales con renglones y 
columnas en una matriz D' de (m — 1) x (n — 1) tal que 

( D f ) u = 0 si i^j, 

(D')ì,ì =1 si i < r - 1, 

(D') , i = 0 si i > r. 


Esto es, que D' consta totalmente de ceros a excepción de las primeras 
r — 1 posiciones de la diagonal principal que tienen unos, Sea 



0 • • • 0\ 

0 



D' 




Vemos que el teorema se establece una vez que queda demostrado que D 
puede obtenerse de B por medio de un número finito de operaciones ele- 
mentales con renglones y columnas. Pero esto se obtiene aplicando repe- 
tidas veces el Ejercicio 12. 

Así, como A puede ser transformada enfiyfi puede ser transformada 
en D, ambas mediante un número finito de operaciones elementales, en- 
tonces A puede ser transformada en D mediante un número finito de 
operaciones elementales. 

Finalmente, como D' contiene unos en las primeras r — 1 posiciones 
sobre la diagonal principal, D contiene unos en las primeras r posicio- 
nes sobre su diagonal principal y ceros en el resto de elîas. Luego entonces, 
D u = 1 si i < r, D n = 0 si / > r, y D u = 0 si i ^ j. Esto establece el 
teorema. ■ 

Corolario 1. Sea A una matriz de m x n de rango r. Entonces existen matrices 
invertibles B y C de dimensiones m x m y n x n, respectivamente, tales 
que D = BAC donde D es una matriz de m x n que satisface 
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(a) 

E>u 

= 0 

si 


(b) 

D„ 

= 1 

si 

i < r, 

(c) 

D„ 

= 0 

si 

i > r. 


demostración . De acuerdo con el Teorema 3.5, A puede ser transfor- 
mada en la matriz D mediante un número finito de operaciones elementales 
con renglones y columnas. Podemos recurrir al Teorema 3.1 cada vez que 
realicemos operaciones elementales. Entonces, existirán matrices elemen- 
tales de m x m E u E 2 , , E p y matrices elementales de n x n G u 

G 2 , . . . , G u tales que 

D E v E p -x . . . E 2 E r AG^G 2 . . . G (J . 

De acuerdo con el Teorema 3.2, todas las Ej y G ; son invertibles. Sean 
B = EpEp-! . . . E x y C = Gi . . . Gq. Entonces, de acuerdo con el Ejer- 
cicio 2 de la Sección 2.4 B y C son invertibles y D = BAC. | 


Corofor/o 2. Sea A una matriz arbitraria de m x n. 


(a) Rango{ A l ) = rango(A). 

(b) El rango de cuaJquier matriz es igual al número máximo de 
renglones linealmente independientes de dicha matriz; esto es, el 
rango de una matriz es la dimensión del subespacio generado 
por los renglones de la matriz. 

(c) Los renglones y las columnas de cualquier matriz generan sub - 
espacios de la misma dimensión, numéricamente iguales al rango 
de la matriz. 


DEMOSTRACIÓN. 

(a) Por el Corolario 1 existen matrices invertibles B y C tales que 
D = BAC , donde D satisface las condiciones enunciadas en el corolario. 
Tomando las transpuestas tenemos 

D f = C f A f B f . 


Puesto que B y C son invertibles, también lo son B { y C f , en virtud del 
Ejercicio 3 de la Sección 2.4. Entonces, por el Corolario 1 del Teore- 
ma 3.3, 

rangoí/íO = rango(OLlL) = rango(D'). 

Supóngase que r = rango (A). Entonces D f es una matriz de n x m 
que satisface las condiciones del Corolario 1 y, por tanto, rango(D') = r 
por el Teorema 3.4. Así, 

rango(/tO = rango(DO = r = rango(/í). 

Esto establece (a). 

Las demostraciones de (b) y (c) se dejan como ejercicios. | 
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Corofarîo 3. Cualquier maíriz invertible es un producto de matrices elementales. 

demostración. Si A es una matriz invertible de n x n, entonces ran- 
go (A) — n, y entonces por el Corolario 1 existen matrices invertibles B 
y C tales que D = BAC , donde Z> i; = 0 para i=£j y Da = 1 para 
1 < i <n. Entonces D = / n ; esto es, / n = 

En la demostración del Corolario 1 nótese que B = E P E P -* ... E t y 
C = G x G 2 . . . G g , donde las E { y las Gi son matrices elementales. Enton- 
ces ^ = B~ 1 I n C~ 1 = Z?-C-\ y así /4 = E’^E' 1 . .. E^G^. .. G~\ Pero 
la inversa de una matriz elemental es elemental y por lo tanto A es el 
producto de matrices elementales. ■ 

Utilizaremos al Corolario 2 para relacionar el rango de un producto 
de matrices con el rango de cada factor. Nótese cómo la demostración 
emplea la relación entre el rango de una matriz y el rango de una trans- 
formación lineal. 

Teorema 3.6. Sean T: V-»W y U: W Z transformaciones lineales en es- 
pacios vectoriales dimensionalmente finitos V, W y Z, y sean A y B matrices 
tales que AB está definido. Entonces 

(a) rango{ UT) < rango{ U) . 

(b) rango{ UT) < rango{ T) . 

(c) rango{AB) < rango{ A) . 

(d) rango{ AB) < rango{ B) . 

demostración . Oaramente se ve que R(T) C W y por lo tanto 
R(UT) = UT(V) = U(R(T)) C U(W) = R(U). 


Entonces 

rango(UT) = dim(R(UT)) < dim(R(U)) = rango(U). 

Esto establece el inciso (a). 

De acuerdo con el inciso (a) 

rango(AB) = rango(L A /î) = rango(\iLzî) < rango(L^) = rango(^4). 
Esto establece el inciso (c). 

En virtud del inciso (c) y del Corolario 2 del Teorema 3.5 
rango(y4B) = rango( (/!£)*) = rango(£\4*) < rango(BU =rango(B). 
Esto establece el inciso (d). 
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Sean >a, y y bases ordenadas para V, W y Z, respectivamente, y sean 
A' = [U]; y B' — [T]* Entonces A'B' — [UT]^ de acuerdo con el Teore- 
ma 2.12. Por lo tanto, por el Teorema 3.3 y el inciso (d), 

rango(UT) = rango (A'B') < rango(£') = rango(T). 

Esto establece el inciso (b). ■ 

Veremos posteriormente que es importante poder calcular el rango de 
cualquier matriz. Podemos emplear el Corolario 2 del Teorema 3.3, los 
Teoremas 3.4 y 3.5 y el Corolario 2 del Teorema 3.5 para Ilevar a cabo 
nuestro propósito. 

EI objetivo es utilizar operaciones elementales con renglones y colum- 
nas en una matriz para “simplificarla” (de tal modo que la matriz trans- 
formada tenga muchos ceros) hasta que una observación sencilla nos 
permita determinar cuántos renglones o columnas linealmente indepen- 
dientes tiene la matriz y así determinar su rango. 

Ejemplo 6. 


( a ) Sea /12 1 3\ 

A = (l 1 -1 ! )• 

Nótese que los renglones de A son linealmente independientes pues uno 
no es múltiplo del otro. Luego, rango(A) = 2. 

(b) Sea 

/■ 3 1 ‘\ 

A = 1 0 1 1 • 

\0 3 0 0/ 

En este caso hay varias maneras para proceder. Supóngase que principia- 
mos con una operación elemental con renglones para obtener un cero en 
la posición 2, 1. Restando el primer renglón del segundo, obtenemos 

/ 1 3 1 

0 -3 0 0 • 

\û 3 0 0/ 

Ahora nótese que el tercer renglón es un múltiplo del segundo, y que el 
primero y el segundo renglones son linealmente independientes. Por tanto, 
rango(/l) = 2. 

Como un método alternativo, nótese que la primera, la tercera y la 
cuarta columnas de A son idénticas y que la primera y la segunda colum- 
nas de A son linealmente independientes. Por lo tanto, rango(/4) — 2. 
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(c) Sea 



2 3 1 
1 1 1 
-1 1 0 


Utilizando diversas operaciones elementales con renglones y columnas, obte- 
nemos la siguiente secuencia de matrices: 


/1 

2 

3 

l ) 

z 1 

2 

3 

\ 

0 

-3 

-5 

-1 

|, 0 

-3 

-5 

1 

\o 

-3 

-2 -ì) 

\o 

0 

3 

0i/ 


/1 0 0 0 \ /1 0 0 0 \ 

( 0 —3 —5 1 ), y ( 0 —3 0 0 1. 

\0 0 3 0/ \0 0 3 0/ 

Es claro que la última matriz tiene tres renglones linealmente independien- 
tes y, por lo tanto, su rango es 3. 


En síntesis, realícense operaciones en renglones y columnas hasta que 
la matriz se haya simplificado lo suficiente, de tal manera que el máximo 
número de renglones o columnas linealmente independientes se haga evi- 
dente. 


La Inversa de una Matriz 

Hemos afirmado que una matriz de n x n es invertible si y sólo si su 
rango es n. Como ya sabemos cómo calcular el rango de cualquier matriz, 
ya podemos determinar si una matriz es o no invertible. Proporcionaremos 
ahora una técnica sencilla para calcular la inversa de una matriz, la cual 
empleará operaciones elementales con renglones. 

Definición. Sean A y B matrices de m x n y de m x p, respectivamente. Por 
matriz aumentada (A | B) entenderemos la matriz de m x (n-f p) 

(A\ , A“, B\ ... ,B>), 

donde A s y B j significan la i-ésima columna de A y la j-ésima columna 
de B, respectivamente. 

Sea A una matriz invertible de n x n y considérese la matriz aumen- 
tada C = (A | / n ) de n x 2 n. En virtud del Ejercicio 15 tenemos 


A-'C= (A-'A \A-'Z n ) = (I n \A-'). 


( 1 ) 



156 Operaciones en matrices y sistemas de ecuaciones lineales 

Por el Corolario 3 del Teorema 3.5, A- 1 es el producto de matrices ele- 
mentales, digamos A 1 = E P E V - X . .. E x . Entonces la Ecuación (1) se trans- 
forma en 

E P E V - X . . . E,(A | I n ) = A~'C = (/n | A -). 

Como multiplicar a una matriz por la izquierda por una matriz elemental 
transforma a la matriz en la misma forma que una operación elemental 
con renglones (Teorema 3.1), tenemos el siguiente resultado: Si A es una 
matriz invertible de n x n, entonces es posible transformar la matriz 
(A | / n ) en la matriz (/ n | A~ x ) por medio de un número finito de opera- 
ciones elementales con renglones. 

Recíprocamente, supóngase que A es invertible y que la matriz (A | / n ) 
puede ser transformada en la matriz (I n | B) mediante un número finito de 
operaciones elementales con renglones. Sean E u E 2y ... , E p las matrices 
elementales asociadas con estas operaciones elementales con renglones como 
en el Teorema 3.1; entonces 

E p . . . E 2 E r (A | / n ) = (I n | B). (2) 

Haciendo M = E p . . . E 2 E U tenemos de la ecuación (2) que 

M(A\I n ) = (MA | M) = (I n \B). 

Por lo tanto MA = l n y M = B, y se tiene entonces que M = A 1 . Así 
B = M = A- 1 . Así se tiene el siguiente resultado: Si A es una maíriz 
invertible de n x n y si la matriz (A | l n ) se transforma en una matriz de 
la forma (I n | B) por medio de un número finito de operaciones elernen - 
tales con renglones, entonces B = A _1 . 

E1 ejemplo siguiente ilustra este procedimiento. 


Ejemplo 7. Calcularemos la inversa de la matriz 


/0 2 
\3 3 



(E1 lector puede verificar que rango(/l) = 3 para estar seguro de que A 
es invertible.) Para calcular A- 1 debemos utilizar operaciones elementales 
con renglones para transformar la matriz 

/0 2 4 1 0 0\ 

(A\I) — (2 4 2 0 1 0| 

\3 3 1 0 0 1/ 

en (/ | A- 1 ). E1 método más eficiente para llevar a cabo esta transforma- 
ción es transformar sucesivamente las columnas de A, empezando por la 
primera columna, en la correspondiente columna de 1. Como necesitamos 
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un elemento no nulo en la posición 1,1, principiaremos intercambiando 
los renglones 1 y 2. E1 resultado es 

/2 4 2 0 1 0\ 

0 2 4 1 0 0- 

\3 3 1 0 0 1/ 

A fin de colocar un 1 en la posición 1,1 debemos multiplicar el primer 
renglón por 1; esta operación nos da 

/1 2 1 0 \ 0\ 

0 2 4 1 0 0- 

\3 3 1 0 0 1/ 

Ahora completamos nuestra labor sobre la primera columna al sumar al 
tercer renglón — 3 veces el primero para obtener 

/1 2 10 i 0\ 

0 2 4 1 0 0- 

\0 -3 -2 0 -\ 1/ 

Para transformar la segunda columna de la matriz anterior en la segun- 
da columna de / multiplicaremos el renglón 2 por i para obtener tm 1 
en la posición 2,2. Esta operación da 

/1 2 10 i 0\ 

0 1 2 i 0 0- 

\o -3 -2 0 -\ 1/ 

Podemos ahora completar el trabajo en la segunda columna sumando —2 
veces el renglón 2 al renglón 1 y 3 veces el renglón 2 al renglón 3. 
E1 resultado es 

/1 0-3-1 \ 0\ 

0 1 2 \ 0 0 - 

\o 0 4 \ -\ 1/ 

Unicamente queda por transformar la tercera columna. Para colocar 
un 1 en la posición 3,3 multiplicamos el renglón 3 por i; esta operación 
da 

/1 0-3-1 \ 0\ 

0 1 2 \ 0 0 - 

\o 0 1 | —| \) 


La suma de múltiplos apropiados del renglón 3 a los renglones 1 y 2 
completa el proceso y da 
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/10 0 i -i *\ 

0 1 0 -i l -ú 

\0 o 1 i -i i/ 


Entonces 


■i = - 



E1 ser capaces de calcular la inversa de una matriz nos permite calcu- 
lar el inverso de una transformación lineal. E1 ejemplo siguiente muestra 
la técnica. 

Ejemplo 8 . Sea T: P 2 (jR) — > P 2 (JR) definida mediante T(/) —/ + /' + 
/", donde /' y /" son la primera y la segunda derivadas de /. Se puede 
demostrar fácilmente que N(T) = (0), de manera que T es învertible. To- 
mando J3 = (1, x, x 2 }, tenemos 



Y encontramos que la inversa de la matriz es 

f ^ 

Pero ({T]p) -1 = [T-'Jp por el Corolario 1 del Teorema 2.21. Por lo tanto, 
por el Teorema 2.16, tenemos que 

\ 

T _1 (a 0 + a Y x + a 2 x 2 ) — (a 0 — a x ) + ( a x — 2a 2 )x + a 2 x 2 . 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) E1 rango de una matriz es igual al número de sus columnas no nulas. 

(b) E1 producto de dos matrices siempre tiene rango igual al menor de 
los rangos de las dos matrices. 

(c) La matriz cero de m x n es la única matriz de m x n de rango 0. 

(d) Las operaciones elementales con renglones conservan el rango. 

(e) Las operaciones elementales con coiumnas no necesariamente conser- 
van el rango. 
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(f) E1 rango de una matriz es igual al máximo número de renglones li- 
nealmente independientes de la matriz. 

(g) La inversa de una matriz se puede calcular exclusivamente por medio 
de operaciones elementales con renglones. 

(h) E1 rango de una matriz de n x n es a lo más n. 

(i) Una matriz de n x n de rango n es invertible. 


2 . Encontrar el rango de las matrices siguientes: 
(a) 


(d) 


1 

°\ 

(b) /1 

1 

°\ 

(c) ( 

1 

1 

2 

1 

1 

\ 

1 

0 / 

\l 

1 

l/ 



(f) 


0 

1 


/i 2 





(e) 

/1 

2 


3 

1 

n 

\2 4 

2/ 





1 

4 


0 

1 

2 







0 

2 

- 

-3 

0 

1 







ll 

0 


0 

0 

0/ 

1 

2 

0 

i 

1\ 

(g) 

f 1 

1 

0 



2 

4 

1 

3 

0 


[2 

2 

0 

2 



3 

6 

2 

5 

1 


I 1 

1 

0 

'i 



4 - 

-8 

1 

-3 

1/ 


il 

1 

0 

1 ) 




Demostrar que para cualquiera matriz A de m x n, rango(^) — 0 si y solo 
si A es la matriz nula. 


4. Utilizar operaciones elementales con renglones y columnas para transformar 
cada una de las matrices siguientes en una matriz D que satisfaga las condi- 
ciones del Teorema 3.5, y luego determinar el rango de cada matriz. 

(a) 


/ 1 

1 

1 2 \ 

(b) / 2 


2 

0 - 

1 2 

-í 

2 

\i 

1 

1 2/ 

\ 2 

1/ 


Para cada una de las siguientes matrices calcular el rango y la inversa, si 
ésta existe. 

(a) 


/1 2\ (b) /0 

-2 

4 \ 

(c) / 1 

2 

!\ 

\1 1/ 1 

1 


H 

1 

2 

\2 

4 

- 5 / 

\ 1 

0 

l/ 


(d) /1 2 1 \ 

(e) 

/1 

0 

1 

1 \ 

1 ° 1 


1 

1 

-1 

2 

\l 1 l/ 


2 

0 

1 

0 



\o 

-1 

1 

- 3 / 
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6 . Para cada una de las siguientes transformaciones lineales T, determinar si 
T es invertible y calcular T _1 si existe. 

(a) T: P 2 (R) P 2 (R) definida por T(/> = /" + 2/' - / 

(b) T: R 3 —> R 3 definida por 

T(ûi, a 2ì a 3 ) — (#i + 2a 2 + a 39 a^ + a 2 + 2a 2ì a± + a 3 ) 

(c) T: R 3 —> P 2 {R) definida por 

T(a 1? a 2 , a 3 ) — (a x + a 2 + a 3 ) + (a x — a 2 + a ó )x + a ± x 2 

7. Expresar la matriz invertible 



como un producto de matrices elementales. 

8 . Sea A una matriz de m x n. Demostrar que si c es cualquier escalar no 
nulo, entonces rango(czl) — rango(^4). 

9. Completar la demostración del Corolario 2 del Teorema 3.3 demostrando 
que las operaciones elementales con columnas conservan el rango. 

10 . Demostrar el Teorema 3.5 para el caso en que A es una matriz demx 1. 

11. Sea 



donde B ' es una submatriz de m x n. Demostrar que si rango(B) = r, 
entonces rango (B') = r — 1. 

12. Sean B f y D' matrices de m x n y sean B y D las matrices de (m + 1) x 
(rci+ 1) definidas por 
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Demostrar que si B' puede transformarse en D' mediante una operación 
elemental con renglones [columnas], entonces B puede transformarse en D 
mediante una operación elemental con renglones. 

13. Demostrar los incisos (b) y (c) del Corolario 2 del Teorema 3.5. 

14. Sean T, U: V=>W transformaciones lineales. Demostrar que 

(a) R(T + U) Ç R(T) + R(U). 

(b) Si W es dimensionalmente finito, entonces rango(T + U) < rango(T) 
+ rango(U). 

(c) Deducir del inciso (b) que, para cualquier par de matrices A y B 
d e m x n, rango(>4 + B) < rango(y4) + rango(B). 

15. Si A y B son matrices de n renglones, demostrar que M(A \ B) = (MA \ 
MB) para cualquier matriz M de m x n. 

16. Demostrar que si B es una matriz de 3 x 1 y C una matriz de 1 x 3 enton- 
ces el rango de la matriz BC de 3 x 3 es a lo más 1 . Recíprocamente, 
demostrar que si A es cualquier matriz de 3 x 3 con rango 1 , entonces 
existen una matriz B de 3 x 1 y una matriz C de 1 x 3 tales que A — BC . 


3.3 SISTEMAS DE ECUACIONES LINEALES: 
ASPECTOS TEORICOS 


Esta sección y la siguiente están dedicadas al estudio de los sistemas de 
ecuaciones lineales, los cuales se presentan de manera natural tanto en las 
ciencias físicas como en las sociales. En esta sección aplicaremos los re- 
sultados del Capítulo 2 para describir a los conjuntos solución de los 
sistemas de ecuaciones lineales como subconjuntos de un espacio vectorial. 
En la Sección 3.4 se utilizarán operaciones elementales con renglones para 
proporcionar un método de cálculo para encontrar todas las soluciones a 
tales sistemas. 

E1 sistema de ecuaciones 


(S) 


I a tí X i + ^12^2 + * ’ • + a \n X n ~ 
a lx X x + a 2 2 X 2 + * • • + a 2n X n = ^2 


a m\ X \ + a m2 X 2 + 


* + a mn X n — 


donde «(,y Wl<i<my 1 < / < n) son elementos de un campo F 
y jc„ xt, ... ,Xn son n variables que toman valores en F, se denomina un 
sistema de m ecuaeiones lineales con n incógnitas sobre el campo F. 
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La matriz de m x n 



se llama la matriz de coeficientes del sistema (S). 
Si expresamos a X y B como 



entonces el sistema (5) se puede reescribir como una ecuación matricial 
única 

AX = B. 


Para utilizar los resultados que hemos desarrollado hasta ahora, a menu- 
do consideraremos a un sistema de ecuaciones lineales como una ecuación 
matricial única. 

Una solución del sistema ( S ) es una rc-dimensional 

• G F n 

sj 

tal que As = B. E1 conjunto de todas las soluciones del sistema ( S ) se 
llama conjunto soiución del sistema. 



Ejemplo 9. 

(a) Considérese el sistema 

f Xt + x 2 = 3 
\ x x — x 2 = 1. 

Utilizando técnicas conocidas podemos resolver el sistema anterior y con- 
cluir que existe una solución únlca: x x = 2, x 2 — 1; es decir, 



E1 sistema puede escribirse de forma matricial como 
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entonces 


A = 


G 



(b) Considérese 


f 2xì + 3x 2 + x 3 = 1 
\ x, — x 2 + 2x 3 = 6; 


o bien. 



Este sistema tiene muchas soluciones tales como 


/— 6 \ 


8 \ 


5 = 2 y í= -4 


(c) Considérese 


JTi + x 2 = 0 

+ +> — l; 


o bien, 


(I :x:;)-0 


Es evidente que este sistema no tiene soluciones y entonces vemos que 
un sistema de ecuaciones lineales puede tener ima, muchas o ninguna 
solución. 


Debemos ser capaces de reconocer cuándo un sistema tiene soluciones 
y luego ser capaces de describir todas las soluciones. Esta sección y la 
siguiente estarán dedicadas a este fin. 

Principiaremos nuestro estudio de sistemas de ecuaciones examinando 
el tipo de sistemas “homogéneos” de ecuaciones lineales. Como veremos 
posteriormente (Teorema 3.7), el conjunto de soluciones de un sistema 
homogéneo de m ecuaciones lineales con n incógnitas forma un subespacio 
de F n . Podemos entonces aplicar la teoría de los espacios vectoriales a 
este conjunto de soluciones. Por ejemplo, se puede encontrar una base 
para el espacio solución y cualquier solución puede expresarse como una 
combinación lineal de los vectores de la base. 

Definición . Se dice que un sistema AX — B de m ecuaciones con n incógnitas 
es homogéneo si B = 0; de lo contrario se dice que el sistema es no 
homogéneo. 
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Todo sistema homogéneo tiene al menos una solución, a saber, 


s = 


/ 0 \ 

\o 


Esta solución se denomina la solución trivial. E1 siguiente resultado pro- 
porciona más información sobre el conjunto de soluciones de un sistema 
homogéneo. 


Teorema 3.7. Sea AX = 0 un sistema homogéneo de ecuaciones lineales con 
n incógnitas sobre un campo F. Sea K el conjunto de todas las soluciones 
para AX = 0. Entonces K = N(L A ); por lo tanto, K es un subespacio de 
F n de dimensión n — rango( L A ) = n — rango( A). 

demostración. K = {s £ F n : As = 0} = N(L a ). La segunda parte se si- 
gue del Teorema 2.3. ■ 


Corolario. Si m < n el sistema AX = 0 tiene una solución no trivial. 

demostración. Supóngase que m < n. Entonces rango(/í) = rango(L 4 ) 
< m, y entonces dim(K) = n — rango(L A ) > n — m > 0. Como dim(K) 
>0, K ^ {0}. Luego, existe s Ç. K, s =£0. Entonces s es una solución no 
trivial para AX — 0. ■ 


Ejemplo 10. 


(a) Considérese el sistema 


Sea 


f* + 2x 2 + Xz = 0 
- x 2 - x :ì = 0. 



la matriz de coeficientes. Es evidente que rango(^) = 2. Si K es el 
conjunto solución del sistema, entonces dim(K) = 3 ~ 2 = 1. Luego, 
cualquier solución no nula será una base para K. Por ejemplo, como 




es una solución, 
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es una base. Entonces cualquier elemento de K es de la forma 



donde l£R. 

(b) Considérese al sistema x^ — 2x 2 + x 3 = 0 de una ecuación ccn 
tres incógnitas. Si A = (1, — 2, 1) es la matriz de coeficientes, rango(y4) 
= 1. Por lo tanto, si K es el conjunto solución, dim(K) =3 — 1 = 2. 
Nótese que 



son elementos de K linealmente independientes. Por lo tanto constituyen 
una base para K, tal que 


K - 



t u t 2 G R 


En la Sección 3.4 expondremos métodos explícitos de cálculo para 
encontrar una base para el conjunto solución de un sistema homogéneo. 


Ahora pasaremos al estudio de los sistemas no homogéneos. Nuestro 
siguiente resultado muestra que el conjunto de soluciones de un sistema no 
homogéneo AX = B puede expresarse en términos del conjunto de solu- 
ciones del sistema homogéneo AX = 0. Nos referiremos a la ecuación 
AX = 0 como al sistema homogéneo correspondiente a AX = B. 


Teorema 3.8. Sea K el conjunto solución de un sistema de ecuaciones lineales 
AX = B y sea K H el conjunto solución del sistema homogéneo corres - 
pondiente AX = 0. Entonces para cualquier solución s de AX = B 

K-{s} + K h = {s + k: k g K h }. 

demostración. Sea s cualquier solución de AX = B. Demostraremos que 
K = {5 1 } + K h . Si w £ K, entonces Aw = B. De aquí que A(w — s) = 
Aw — As = B — B = 0. Entonces w — s £ K H . Luego, existe k £ K H tal 
que w — s = k, de manera que >v = í + /:£{5 , } + K H , y por lo tanto 

K £ M + K h . 

Recíprocamente, supóngase que w Ç_ {5 1 } + K H entonces w = s + k 
para alguna k Ç_K. Pero entonces Aw = A(s + k) = As + Ak = B + 0 
= B , de manera que w £ K. Por lo tanto {s} + K H Ç K y entonces K = 
{^} + K H . ■ 
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Ejemplo 11. 

(a) Considérese el sistema 


fxi + 2x 2 -f x ;i = 7 

[Xi - x 2 - x% = -4. 

E1 sistema homogéneo cx)rrespondiente al anterior es el sistema dado en 
el Ejemplo 10(a). Puede comprobarse fácilmente que 



es una solución del sistema no homogéneo anterior. Así, el conjunto solu- 
ción del sistema es 



por el Teorema 3.8. 

(b) Considérese al sistema — 2x 2 + jc 3 = 4. E1 sistema homogé- 
neo correspondiente a este sistema está dado en el Ejemplo 10(b). Como 



es una solución de este sistema, el conjunto completo de soluciones K se 
puede escribir como 


K = 






1 1, t 2 e R 


Aun cuando se haya reservado la Sección 3.4 para métodos de cálculo, 
el teorema siguiente nos propK>rciona un medio para calcular las soluciones 
de ciertos sistemas de ecuaciones. 


Teorema 3.9. Sea AX = B un sistema de n ecuaciones y n incógnitas. Si A es 
invertible, entonces el sistema tiene exactamente una solución, que será 
A _1 B. Inversamente, si el sistema tiene únicamente una solución, entonces 
A es invertible . 

demostración. Supóngase que A es invertible. Sustituyendo A l B en el 
sistema, tenemos A(A 'B) = (AA X )B = B, de manera que A 'B es una 
solución. Si s es una solución arbitraria, entonces As = B y al multiplicar 
ambos lados por A _1 se tiene que s = A~ J B. Por tanto, el sistema tiene 
una y sólo una solución, que es A 'B. 
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Recíprocamente, supóngase que el sistema tiene exactamente una solu- 
ción 5 -. Sea K H el conjunto solución para el sistema homogéneo correspon- 
diente AX = 0. Por el Teorema 3.8, {s} + K H , pero esto sólo puede 
tenerse cuando K H — {$}• Entonces N(L^) = {0} y por lo tanto A es 
invertible. ■ 


Ejemplo 12. 

incógnitas: 


Considérese el siguiente sistema de 3 ecuaciones con tres 


( S ) 


2x 2 + 4x 3 = 2 
2xj + 4*2 + 2x 3 = 3 
3x t + 3x 2 + x 3 = 1. 


En el Ejemplo 7 calculamos la inversa de la matriz de coeficientes A de 
este sistema, por lo que (S) tiene exactamente una solución: 




-* h 

1 

-» V 

Utilizaremos esta técnica para resolver sistemas de ecuaciones lineales 
cuyas matrices de coeficientes son invertibles en la aplicación que da fin 
a esta sección. 

En el Ejemplo 9(c) vimos un sistema de ecuaciones lineales que no 
tenía solución. Estableceremos ahora un criterio para determinar cuándo 
un sistema tiene soluciones. Este criterio involucra el rango de la matriz 
de coeficientes del sistema AX = B y el rango de la matriz (A | B). A la 
matriz (A I B) se le denomina malriz aumentada del sistema AX = B. 


Teorema 3.10. Sea AX = B un sistema de ecuaciones lineales. Entonces el 
sistema tiene al menos una solución si y sólo si rango(A) = rango(A | B). 

demostración. Decir que AX = B tiene solución, equivale a decir que 
B £R(La)- En la demostración del Teorema 3.4 vimos que R(La) — L{A\ 
A 2 , . . . , A n }, es el subespacio generado por las columnas de A. En- 
tonces A X = B tiene una solución si y sólo si B pertenece a dicho sub- 
espacio. Pero B £L(^4 l , A 2 , . . . , A n } si y sólo si L{A X , A 2 , . .. , A n } — 
L{A\ A 2 , . .. , A n , B }. Esta última proposición es equivalente a 

dim (L{A\ A 2 ,..., A n j = dim(LM\ A 2 , . .. , A n , B}). 

Y de acuerdo con el Teorema 3.4, la ecuación anterior se reduce a 
rango(/4) = rango(^ | B). ■ 


Ejemplo 13. 


Recuérdese el sistema de ecuaciones 


J jc, + x-j — 0 
JX! + x 2 = 1 


del Ejemplo 9(c). 
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Puesto que 


^ = (J J) y Wl») = (} J ?). 

rango(y4) = 1 y rango (A | B) = 2. Como los rangos no son iguales, el 
sistema no tiene soluciones. 

Ejemplo 14. Utilizaremos el Teorema 3.10 para determinar si (3, 3, 2) 
está en el rango de la transformación lineal T: R 3 R 3 definida por 

T(a 1? « 2 , o 3 ) = (oi + o 2 + o 3 , Oi o 2 + o 3 , a r + o 3 ). 

Pero tenemos que (3, 3, 2) £R(T) si y sólo si existe un vector s = (jc ly 
■* 2 , x 3 ) Ç R 3 tal que T(.y)i= (3, 3, 2). Tal vector s deberá ser una solución 
del sistema 

'x Y + x 2 + x 3 = 3 
-< x t — x 2 + x 3 = 3 
+i + x 3 = 2. 

Como los rangos de la matriz de coeficientes y de la matriz aumentada de 
este sistema son 2 y 3, respectivamente, se tiene que este sistema no tiene 
soluciones. Por lo tanto, (3, 3, 2)0R(T). 


Una aplicación 

En 1973 Wassily Leontief ganó el Premio Nobel de Economía por su 
trabajo en el desarrollo de un modelo matemático que se puede utilizar 
para describir diversos fenómenos económicos. Terminaremos esta sección 
aplicando algunas de las ideas que hemos estudiado para ilustrar dos casos 
especiales de su trabajo. 

Principiaremos considerando una sociedad sencilla constituida por tres 
personas (empresas): un campesino que produce todos los alimentos, un 
sastre que hace todo el vestido y un carpintero que construye todo lo de 
la vivienda. Supondremos que las tres personas venden y compran en im 
abasto central y que todo lo que se produce se consume. Como ningun 
producto entra o sale del sistema, en este caso se trata del modelo cerrado. 

Cada uno de los tres individuos consumirá de cada uno de los tres 
productos producidos dentro de la sociedad. Supóngase que la proporción 
de cada uno de los productos consumidos por cada una de las personas está 
dada en el cuadro siguiente. Nótese que cada una de las columnas del 
cuadro deben sumar 1. 



Alimentación 

Vestido 

Vivienda 

Campesino 

0.40 

0.20 

0.20 

Sastre 

0.10 

0.70 

0.20 

Carpintero 

0.50 

0.10 

0.60 
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Sean p„ p 2 y p 3 respectivamente los ingresos del campesino, del sastre 
y del carpintero. Para tener la certeza de que esta sociedad sobrevive, se 
requiere que el consumo de cada individuo sea igual a su ingreso. En el 
caso del campesino, este requisito puede traducirse en la ecuación 
0.40p, + 0.20p 2 + 0.20p 3 = p„ Entonces necesitamos considerar el sis- 
tema de ecuaciones lineales 

'0.40?! + 0.20p 2 + 0.20p 3 = Pi 
< 0.10?! + 0.70? 2 + 0.20?s = ?2 
0.50?i + 0.10p 2 + 0 . 60?3 = ? 3 

o su equivalente, AP = P, donde 



y A es la matriz de coeficientes del sistema. Dentro de este contexto + 
se denomina matriz de consumo y AP — P la condición de equilibrio. 

Para matrices B y C del mismo tamano utilizaremos la notación 
B>C[B> C ] para indicar B tj > C ti [Bi, > C 4j ] para toda i y /. B se 
denominará no negativa [positiva ] si B > 0[B > O], donde O es la matriz 

nul 3 - 

A1 principio puede parecer razonable reemplazar la condición de equi- 
librio por la desigualdad AP < P, esto es, la condición que el consumo 
no exceda a la producción. Pero de hecho AP < P implica que AP — P 
en el modelo cerrado, pues de otra manera existiría una k para la cual 

Pk> 2 A k jPj. 

3 

Por tanto, como las columnas de A suman 1, 

2 Pi > 22 Aup, = 2 (2 A, j) Pj = 2 Ph 

i i j 3 4 î 

lo cual es una contradicción. 

Una solución del sistema homogéneo (/ A)X 0 equivalente a la 
condición de equilibrio es 



Podemos interpretar este hecho como indicando que la sociedad sobrevivirá 
si el campesino, el sastre y el carpintero tienen ingresos en la proporción 
25:35:40 (o 5:7:8). 

Nótese que no estamos interesados simplemente en una solucion no 
trivial al sistema, sino en una que sea no negativa. Por ello debemos consi- 
derar si el sistema (/ - A)X = 0 tiene o no una solución no negativa, 



170 Operaciones en matrices y sistemas de ecuacîones lineales 

donde A sea una matriz no negativa cuyas columnas suman 1. Un teore- 
ma útil en este aspecto [cuya demostración puede encontrarse en la publi- 
cación “Aplicaciones de las Matrices a Modelos Económicos y a las 
Interrelaciones de las Ciencias Sociales” de Ben Noble, Proceedings of the 
Summer Conjerence for College Teachers on Applied Mathematics (1971), 
CUPM, Berkeley, Califomia] se enuncia a continuación. 

Teo rema 3.11. Sea A una matriz de consumo de n x n de la forma 



donde D es una matriz positiva de 1 x (n - 1) y C es una matriz positiva 
de (n 1) x 1. Entonces (I A)X = 0 tiene un conjunto de soluciones 
unidimensionál generado por un vector no negativo. 

Obsérvese que toda matriz de consumo positiva satisface la hipótesis 
de este teorema. La matriz siguiente también la satisface. 

/0.75 0.50 0.65\ 

I 0 0.25 0.35] 

\0.25 0.25 0 / 

En el modelo abierto suponemos que existe una demanda externa para 
cada uno de los productos producidos. Volviendo a nuestra sociedad sen- 
cilla, sean x,, x 2 y x 3 las cantidades de alimento, vestido y vivienda produ- 
cidas en función de Ias demandas externas d u d. y d 3 . Sea A la matriz 
de 3 x 3 tal que A if representa la proporción del producto i consumido 
en producir el producto j. Entonces el superávit de alimentos en la so- 
ciedad es 

*i ~ (''LiX, + A 12 X 2 + A 13 x : i ), 

esto es, la cantidad de alimentos producidos menos la cantidad de alimen- 
tos consumidos para producir Ios tres productos. La suposición de que 
todo lo producido se consume nos da una condición de equilibrio similar 
para el modelo abierto, esto es, que los superávits de cada uno de los 
tres productos deben ser iguales a las correspondientes demandas externas. 
Por lo tanto 

3 

x, ^ A íjXj d'i para / = 1, 2 y 3. 

/ = 1 

En general, debemos encontrar una solución no negativa para el siste- 
ma (/ — A)X — D, donde A y D son matrices no negativas y la suma 
de los elementos de las columnas de A no es mayor que uno. Es fácil 
ver que si (/ — A)- 1 existe y es no negativa, entonces la solución deseada 
será (/ — AY'D. 

Recuérdese que para un número real a, la serie 1 + a + a- + ... con- 
verge a (1 - a)- 1 si \a \ < 1. De la misma manera puede demostrarse 
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(utilizando el concepto de convergencia de matrices desarrollado en la 
Sección 5.3) que la serie / H- A + A 2 + ... converge a (/ — A)- 1 si A n 
ccnverge a la matriz nula. En este caso (/ — A)- 1 será no negativa puesto 
que las matrices /, A, A 2 , ... son no negativas. 

Para ilustrar el modelo abierto, supóngase que el 30% de los alimen- 
tos se utiliza para producir alimentos, 20% para producir vestido y 30% 
para la vivienda. De la misma forma, supóngase que el 10% del vestido 
se destina a la producción de alimentos, 40% para producir vestido y 
10% para la vivienda. Finalmente, supóngase que 30% de la vivienda 
se utiliza para producir alimentos, 20% para producir vestido y 30% 
para la producción de la vivienda. Entonces, la matriz de consumo es 


' 0.30 

0.20 

0 . 30 ' 

0.10 

0.40 

0.10 

, 0.30 

0.20 

0 . 30 , 


y entonces 


/ 0.70 

- 0.20 

— 0 . 30 \ 

/ 2.0 

1.0 

io\ 

I — A = | —0.10 

0.60 

— 0.10 I 

y (/-^ r = 0.5 

2.0 

0.5 

\— 0.30 

- 0.20 

0 . 70 / 

\l.O 

1.0 

2 . 0 / 


Como (/ — A)- 1 es no negativa podemos encontrar una solución no nega- 
tiva (única) para (/ — A)X = D para cualquier demanda Z>. Por ejemplo 


D = 



entonces 


X = (I-A)~'D 



Entonces, se debe producir un volumen de producción de 90 unidades de 
alimentos, 60 unidades de vestido y 70 unidades de vivienda para satis- 
facer una demanda de 30 unidades de alimentos, 20 unidades de vestido 
y 10 unidades de vivienda. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Cualquier sistema de ecuaciones lineales tiene al menos una solución. 

(b) Todo sistema de ecuaciones lineales tiene como máximo una solución. 
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(c) Cualquier sistema homogéneo de ecuaciones lineales tiene al menos 
una solución. 

(d) Cualquier sistema de n ecuaciones lineales con n incógnitas tiene 
como máximo una solución. 

(e) Cualquier sistema de n ecuaciones lineales con n incógnitas tiene al 
menos una solución. 

(£) Si el sistema homogéneo correspondiente a un sistema de ecuaciones 
lineales dado tiene una solución, entonces el sistema dado tiene una 
solución. 

(g) Si la matriz de coeficientes de un sistema homogéneo de n ecuaciones 
lineales con n incógnitas es invertible, entonces el sistema carece de 
soluciones triviales. 

(h) E1 conjunto solución de cualquier sistema de m ecuaciones lineales 
con n incógnitas es un subespacio de F n . 

2 . Para cada uno de los siguientes sistemas de ecuaciones lineales, encontrar 
la dimensión y ima base para el conjunto solución. 

(a) í JCj + jc 2 - x 3 = 0 (b) f2x, + x 2 — x 3 = 0 

[4X! + x 2 — 2 x 3 = 0 < *i — x 2 + x 3 = 0 

jCj + 2x z — 2 x 3 = 0 

(c) Xi + 2x 2 — 3x 3 + x^ = 0 (d) ÍXi + 2x 2 = 0 

\xi - x 2 =0 

3 . Utilizando los resultados del Ejercicio 2 encontrar todas las soluciones de 
los siguientes sistemas. 

(a) x x + x 2 — x 3 = 1 (b) 2x x + x 2 — x 3 = 5 

Ax x + x 2 — 2 x 3 =3 ' x x — x 2 + x 3 = 1 

. x x + 2x 2 — 2x 3 =4 

(c) x*! + 2x 2 — 3x 3 + x A = 1 (d) ÍXj + 2x 2 = 5 

1*, — x 2 = — 1 

4. Sea A la matriz de coeficientes de 

x^ + 2x 2 — x 3 = 5 
x t + x 2 + x 3 = \ 

2x { — 2x 2 + x 3 = 4. 

(a) Demostrar que A es invertible. 

(b) Calcular A~ 2 . 

(c) Utilizar A~ x para resolver el sistema. 

5. Dar un ejemplo de un sistema de n ecuaciones con n incógnitas con un 
número infinito de soluciones. 
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6 . Sea T: R 3 -^>R 2 definida por T (a, b, c) = (a + b 9 2a — c). Describir 

t-HO, 11)}. 

7. Deterxninar cuál de los siguientes sistemas de ecuaciones lineales tiene so- 
lución. 


(a) 

[* 

1 + x 2 — 

x 3 

+ 2x 4 

= 2 

(b) i 

í* 

+ 

*2 - 

x 3 1 




1 + X 2 + 

2x 3 


= 1 


[2x! 

+ 

x 2 + 3x } = 2 



I 2 * 

1 + 2*2 + 

x 3 

+ 2x 4 

= 4 







(c) 

*1 

+ 2x 2 + 3x 3 ^ 



(d) 

Xi 

+ 

X 2 

+ 3x 3 — x 4 

= 0 



+ x 2 — 

x 3 = 

= 0 



X\ 

+ 

x 2 

+ X 3 + 

= 1 


*1 

+ 2x z + 

X 3 -- 

= 3 



Xi 

— 

2x 2 

+ 

= 1 








4xj 

+ 


+ 8 X 3 — x 4 

= 0 


8 . Demostrar que un sistema AX = B de m ecuaciones lineales con n incóg- 
nitas tiene solución si y sólo si B Ç R(U). 


9. Demostrar o dar un contraejemplo al siguiente enunciado: Si la matriz de 
coeficientes de un sistema de m ecuaciones lineales con n incógnitas tiene 
rango m, entonces el sistema tiene una solución. 


10 . En el modelo cerrado de Leontief con alimentación, vestido y vivienda como 
industrias básicas, supóngase que la matriz de consumo es 

/ì h i A\ 

A - A * A - 
\i i if 

^En qué proporción deben producir el campesino, el sastre y el carpintero 
de manera que se alcance el equilibrio? 


11 . En la representación del modelo abierto de Leontief, supóngase que 

Hl!) 

y que el vector de demanda es D — óCuánto de cada producto se 

deberá producir para satisfacer esta demanda? 


3.4 S/STEMAS DE ECUACIONES LINEALES: 

ASPECTOS DE CALCULO 

En la Sección 3.3 obtuvimos una condición necesaria y suficiente para que 
un sistema de ecuaciones lineales tenga soluciones (Teorema 3.10) y 



174 Operaciones en matrices y sistemas de ecuaciones lineales 


aprendimos cómo expresar las soluciones de un sistema no homogéneo en 
términos de las soluciones del sistema homogéneo correspondiente (Teo- 
rema 3.8). Este último resultado nos permite determinar todas las solu- 
ciones de un sistema dado si podemos encontrar una solución de dicho 
sistema y una base para el conjunto solución del sistema homogéneo corres- 
pondiente. En esta sección utilizaremos las operaciones elementales con 
renglones para alcanzar estos dos objetivos. La esencia de esta técnica es 
transformar un sistema dado de ecuaciones lineales en un sistema que 
tenga las mismas soluciones pero que sea más fácil de resolver (como 
en la Sección 1.4). 

Definición. Dos sistemas de m ecuaciones lineales con n incógnitas se llanym 
equivalentes si tienen el núsmo conjunto de soluciones. 

E1 siguiente teorema y su corolario nos proporcionan un método útil 
para obtener sistemas equivalentes. 

Teorema 3.12. Sea (S): AX = B un sistema de m ecuaciones lineales con n 
incógnitas y sea C cualquier matriz invertible de m x m. Entonces el 
sistema (S'): (CA)X = CB es equivalente a (S). 

DEMOSTRACIÓN. Sea K el conjunto de soluciones para (S) y K' el con- 
junto de soluciones para ( S '). Si w £K, entonces Aw = B. Luego entonces, 
CAw = CB y por lo tanto >v £K'. Entonces K Ç K'. 

Recíprocamente, si w£K ' 9 entonces CAw = CB. En consecuencia, 
Aw = &'(CAw) = C _1 (CB) = B y así w £K. Entonces K' Q K, y por 
lo tanto K = K'. ■ 

Corolario. Sea AX = B un sistema de m ecuaciones lineales con n incógnitas. 
Si (A' | B') se obtiene a partir de (A | B) mediante un número finito de 
operaciones elementales con renglones, entonces el sistema A'X = B' es 
equivalente al sistema original. 

demostración. Supóngase que (A' ( B') se obtiene de (A | B) por me- 
dio de operaciones elementales con renglones. Estas se pueden realizar 
multiplicando por matrices elementales de m x m E u . .. , E v . Sea C = 
E p . . . E y \ entonces (A' \ B') = C(A | B) = (CA \ CB ), y como todas 
las Ei son invertibles también lo es C. Ahora bien, A' = C^4 y B' = CB. 
Luego, por el Teorema 3.12, el sistema A'X = B' es equivalente al siste- 
ma AX ~ B. ■ 


Ejemplo 15. Para encontrar todas las soluciones de 

Ai + 2 x 2 + x 3 — x 4 =2 
< + *2 + X 3 = 3 

y 3x { + 2x 2 + 3x 3 — 2x 4 = 1, 
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construimos la matriz aumentada 

1 2 1 — 1 2\ 

111 03) 

3 2 3 -2 1/ 

del sistema y la simplificamos mediante una secuencia de operaciones ele- 
mentales con renglones de la siguiente manera. 

(a) Colocamos 1 en el primer renglón, primera columna. (Esto es 
ya el caso.) 

(b) Por medio de operaciones del tipo 3, utilizamos el primer ren- 
glón para obtener ceros en las posiciones restantes de la primera 
columna. La matriz que se obtiene es 

/1 2 1-1 
I0 —1 0 1 

\0 -4 0 1 

Para las operaciones restantes ya no se utiliza el primer renglón. 

(c) Luego (utilizando los renglones restantes) colocamos un 1 en 
el segundo renglón y en la columna lo más a la izquierda posible —en 
este caso la segunda columna. Entonces hacemos operaciones con 
renglones del tipo 3 para obtener ceros en las posiciones restantes de 
esta columna. Estas operaciones dan 

10 1 1 4 

0 10-1-1 
0 0 0 -3 -9 

(d) Para terminar, utilizando únicamente el renglón restante, coloca- 
mos un 1 en el tercer renglón y la columna lo más a la izquierda po- 
sible, en este caso la cuarta columna. Por medio de operaciones del 
tipo 3, usamos este 1 para producir ceros en la cuarta columna, y 
así obtenemos 

1 0 1 0 1\ 

0 10 0 2 )- 
0 0 0 1 3/ 

Esta última matriz puede ser traducida a un sistema de ecuaciones 

+ x 3 = 1 

< x 2 =2 

k — 3 

equivalente al sistema dado. Evidentemente x 2 ” 2 y x 4 — 3, pero y 
jc 3 pueden tener cualquier valor siempre que su suma sea 1. Haciendo 
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x 3 — /, tenemos entonces que x x = 1 — /. Luego, una solución arbitraria 
tiene la forma 



Obsérvese que 



es una base para el sistema de ecuaciones homogéneo correspondiente al 
sistema dado. 


En el ejemplo anterior realizamos operaciones elementales con renglo- 
nes en la matriz aumentada del sistema hasta obtener la matriz aumentada 
de un sistema con las propiedades 1, 2 y 3 dadas en la página 29. Esa 
matriz tiene un nombre especial. 

Definición . Se dice que una maîriz es escalonada por renglones si se satisfacen 
las tres condiciones siguientes: 

(a) Cualquier renglón que tenga un elemento no nulo precederá a 
cualquier renglón (si es que existe alguno) donde todos los ele- 
mentos sean ceros. 

(b) El primer elemento no nulo de cada renglón es el único elemento 
no nulo en su columna. 

(c) El primer elemento no nulo en cada renglón es 1 y aparece en 
una coîumna que está a la derecha del 1 que encabeza a cual- 
quier renglón anterior. 

Ejemplo 16. 

(a) La primera matriz del Ejemplo 15(d) es una matriz escalonada 
por renglones. Nótese que el primer elemento no nulo de cada renglón es 
1 y que la columna que lo contiene tiene ceros en el resto de los elemen- 
tos. También véase que cada vez que nos desplazamos hacia abajo a un 
nuevo renglón, debemos desplazarnos cuando menos una (y posiblemente 
más) columna(s) hacia la derecha para encontrar el primer elemento no 
nulo del nuevo renglón. 
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(b) Las siguientes matrices no son escalonadas por renglones: 

/' 1 °\ 

0 1 o . 

\1 0 1 / 

porque la primera columna contiene más de un elemento no nulo; 

/0 1 0 2 \ 

(l 0 0 l)> 

\o 0 1 1 / 

porque el primer elemento no nulo del segundo renglon no está a la 
derecha del primer elemento no nulo del primer renglón; y 



porque el primer elemento no nulo del primer renglón no es 1. 

La facilidad con que resolvimos el sistema final de ecuaciories del 
Ejemplo 15, se debe al hecho de que la matriz aumentada de este sistema 
es una matriz escalonada por renglones. Presentaremos en seguida un 
procedimiento para resolver cualquier sistema de ecuaciones lineales para 
el cual la matriz aumentada sea una matriz escalonada por renglones. Sin 
embargo, primero estableceremos que toda matriz puede ser transformada 
en una matriz escalonada por renglones mediante operaciones elementales 
con renglones. 

Teorema 3.13. Toda matriz puede ser transformada en una matriz escalonada 
por renglones por medio de un número finito de operaciones elementales 
con renglones. 

demostración. La demostración se hará por inducción sobre el número 
de columnas de la matriz. Dejaremos como ejercicio la demostración del 
resultado para matrices de una columna. Sup>óngase que la conclusión es 
válida para matrices que tienen n columnas, para algún entero n > 1, y 
sea A una matriz de m x (n + 1). Escríbase A en la forma A — 
(A' | B), donde B es la última columna de A y A' es la matriz demx« 
obtenida al suprimir la última columna de A. Por la hipótesis de induc- 
ción, A' puede ser transformada en una matriz Q escalonada por renglo- 
nes por medio de un número finito de operaciones elementales con renglo- 
nes. Sea C el producto de las matrices elementales que corresponden a 
estas operaciones con renglones. Entonces 

CA = C(A' | B) = (CA' | CB) = (Q \ B'), 
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donde B' — CB. Claramente (Q j B') es una matriz escalonada por ren- 
glones a menos que contenga un renglón de la forma (0 ... 0 a) donde 
aý=0. Multiplicando a tal renglón por a~\ sumando múltiplos adecuados 
de este renglón a los otros renglones y realizando el intercambio adecua- 
do de renglones, para alguna j podemos transformar (Q | B') en una ma- 
triz (Q ) ej) escalonada por renglones por medio de un número finito de 
operaciones elementales con renglones. Esto completa la inducción. ■ 

Puede demostrarse (véase el Ejercicio 9) que a toda matriz le corres- 
ponde una única matriz escalonada por renglones; esto es, si por distintas 
secuencias de operaciones elementales con renglones se transforma a la 
matriz en matrices Q y Q', ambas escalonadas por renglones, entonces 

Q = Q'. 

Describiremos ahora un método para resolver un sistema en el que 
la matriz aumentada sea una matriz escalonada por renglones. Para ilus- 
trar el procedimiento, consideremos al sistema 

'2xi + 3* 2 + x 3 + 4x 4 — 9x 5 = 17 

x i -j x 2 + x 3 + x 4 — 2x 3 — 6 

x t + x 2 + x 3 + 2x 4 — 5x s = 8 

.2*, + 2x 2 + 2x 3 + 3x 4 — $x s = 14 

para el que la matriz aumentada es 

/2314-9 17\ 

1111- 3 6 

1112- 5 8 

\2 2 2 3 -8 14/ 

La siguiente secuencia de matrices obtenida por operaciones con renglones 
ilustra cómo se transforma a la matriz aumentada en una matriz escalo- 
nada por renglones: 


( l 

1 

1 

i 

-3 

6 Ì 


i 1 

1 

1 

1 

-3 

<5\ 

'2 

3 

1 

4 

-9 

17 


10 

1 

-1 

2 

-3 

5 

1 

1 

1 

2 

-5 

8 J 


0 

0 

0 

1 

-2 

2 

\2 

2 

2 

3 

-8 

14/ 


10 

0 

0 

1 

-2 

2/ 



0 

2 

-1 

0 

l ) 


( l 

0 

2 

0 

-2 

3 \ 

0 

1 

-1 

2 

-3 

5 


ío 

1 

-1 

0 

1 

1 

0 

0 

0 

1 

-2 

2 i 


0 

0 

0 

1 

-2 

2 

\o 

0 

0 

0 

0 

0/ 


\0 

0 

0 

0 

0 

0/ 
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E1 sistema de ecuaciones (equivalente al original) asociado con esta última 
matriz (considerada corno matriz aumentada) es 

Xj + 2x 3 — 2x 5 = 3 

* 2 — * 3 + *5 = 1 

k x 4 — 2x 5 = 2. 

Nótese que hemos ignorado al último renglón pues está totalmente formado 
por ceros. 

Para resolver un sistema para el cual la matriz aumentada toma la forma 
escalonada, divídase a las variables x u x 2 , . . . , x r , en dos conjuntos. E1 primer 
conjunto consta de cada una de las variables que aparecen más a la 
izquierda en las ecuaciones del sistema (en este caso el conjunto es 
(jCi, x 2 , * 4 }). E1 segundo conjunto consta del resto de las variables (en 
este caso, {x lu jc 5 }). A cada variable del segundo conjunto se le asigna 
un valor paramétrico t u t 2 , . . . (jc 5 = x n — t>) y se resuelve para las 
variables del primer conjunto en términos de las del segundo: 

jCj ■ = —2 jc 3 + 2x 5 + 3 — — 2t i + 2í 2 + 3 

x 2 = x 3 — x 5 + 1 = t x — t 2 + 1 

x 4 = 2x 5 + 2 = 2 r 2 + 2. 

Así, una solución arbitraria, s, es de la forma 


l\ 


1 —2 ti + 2 1 2 + 3} 


/ 3 ) 


l~ 2 \ 


2 \ 

x} 


t\ — t 2 + 1 


i 


1 


-1 

x 3 

= 

t x 

= 

0 

+ í, 

1 

+ t 2 

0 

x*\ 


1 2 1 2 + 2 


2 j 


1 0 


1 2 

\xj 


\ t 2 


\oi 


i 0/ 


\ 1 / 


donde t u t 2 £R. Nótese que 



l-A 


2\ ’ 


ì 


-1 


ì 

> 

0 


1 °i 


2 


\ oj 


iL 


forma una base para el conjunto de soluciones correspondiente al sistema 
de ecuaciones homogéneo. 

Para utilizar este procedimiento para resolver un sistema de m ecua- 
ciones con n incógnitas AX = B, véase primero si rango(/í) = rango 
(A | B). Si esta igualdad no se satisface, entonces el sistema no tiene 
soluciones. En seguida (siempre que el sistema tenga soluciones) utilícense 
operaciones elementales con renglones para transformar la matriz aumen- 
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tada (A \B) en una matriz escalonada por renglones (A f \B r ). Descár- 
tense los renglones nulos en (A' | B') y escríbase de nuevo el sistema de 
ecuaciones asociado con (A f \B f ). Resuélvase el sistema como se hizo 
anteriormente y se obtendrá una solución arbitraria de la forma 

S = + UU i + t 2 U 2 + . . . + tn-m'Un-m ', 

donde m' es el número de renglones no nulos en A f , (m < m). La ecua- 
ción anterior sugiere que una solución arbitraria, .y, puede expresarse en 
términos de n — m' parámetros. E1 teorema siguiente establece que s no 
puede expresarse en menos de n — m' parámetros. 

Teorema 3.14. Sea AX — B un sistema de m ecuaciones no nulas con n incóg - 
nitas. Supóngase que rango(A) — rango (A | B) y que (A | B) es una 
matriz escalonada por renglones. Entonces 

(a) rango(A) = m. 

(b) Si la solución general, obtenida por el procedimiento anterior es 
de la forma 

S = S 0 + LUi + t 2 U 2 + . . . + tn-^Un-in, 

entonces {ui, u 2 , . . . , u n _ m } es una base para el conjunto de 
soluciones del sistema homogêneo correspondiente y s 0 es una 
solución del sistema original. 

demostración. Como (A | B) es una matriz escalonada por renglones, 
rango (A | B) — rango(/l) = m, de acuerdo con los Ejercicios 5 y 6. 

Sea K el conjunto de soluciones para AX ^ B y K H el conjunto de 
soluciones para AX = 0. Haciendo h = t 2 = ... = t n „ m — 0 , s = s 0 £K. 
Pero por el Teorema 3.8, K = {s 0 } + K H , por lo que K H — K — {^ 0 } = 
L({u u u 2 , . . . , ww-m}). 

Como rango(A) = m, dim(K H ) — n — m. Entonces como dim(K H ) 
= n — m y K H es generado por un conjunto [u u u 2 , ... , u n - m } que con- 
tiene a lo más n — m elementos, concluimos que el conjunto anterior es 
una base para K H . ■ 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Si (A'\B f ) se obtiene a partir de (A | B) mediante una secuencia 
finita de operaciones elementales con columnas, entonces los sistemas 
AX = B y A'X = B' son equivalentes. 

(b) Si (A' | B') se obtiene a partir de (A | B) mediante una secuencia 
finita de operaciones elementales con renglones, entonces los sistemas 
AX = B y A'X = B' son equivalentes. 
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(c) Si A es una matriz de n x n de rango n , entonces la matriz escalo- 
nada por renglones de A es I n . 

(d) Cualquier matriz se puede convertir en una matriz escalonada por 
renglones por medio de una secuencia finita de operaciones elemen- 
tales con renglones. 

(e) Si (A\B) es una matriz escalonada por renglones, entonces el siste- 
ma AX = B debe de tener una solución. 

(f) Sea AX = B un sistema de m ecuaciones lineales con n incógnitas 
para el cual la matriz aumentada es una matriz escalonada por ren- 
glones. Si este sistema tiene solución, entonces la dimensión del con- 
junto de soluciones de AX = 0 es n — m' , donde m' es igual al núme- 
ro de renglones no nulos de A. 

(g) Si una matriz A se transforma por medio de operaciones elementales 
con renglones en la matriz escalonada por renglones A ', entonces el 
número de renglones no nulos en A' es igual al rango de A. 

2. Encontrar todas las soluciones a los sistemas de ecuaciones en los Ejerci- 
cios 2, 3 y 4 de la Sección 3.3 mediante la técnica usada en esta sección. 

3. Supóngase que la matriz aumentada del sistema AX = B se transforma en 
la matriz escalonada (A' | B') mediante una secuencia finita de operaciones 
elementales con renglones. 

(a) Demostrar que rango(zl') =+ rango((A' \B')) si y sólo si (A' | B') 
contiene un renglón en donde el único elemento no nulo queda ubi- 
cado en la última columna. 

(b) Deducir que AX = B tiene soluciones si y sólo si (A' | B') no contie- 
ne ningún renglón en el cual el único elemento no nulo está ubicado 
en la última columna. 

4. Para cada uno de los siguientes sistemas, aplicar el Ejercicio 3 para deter- 
minar si el sistema tiene soluciones. Si existen soluciones, encontrarlas todas. 
Finalmente, encontrar una base para los sistemas homogéneos correspon- 
dientes. 

(a) + 2x 2 — x 3 + x 4 = 2 (b) (x^ + x 2 — 3x 3 + x 4 

< 2x x + x 2 + x 3 — x 4 = 3 < x, + x 2 + x: 3 — 

, Xj + 2x 2 — 3x 3 + 2x 4 =2 [xì + x 2 ~ x 3 

(c) Xi + x 2 — 3x 3 + x 4 = 1 
< *! + *2 + X 3 ~ X 4 = 2 
X x + x 2 — x 3 = 0 

5. Demostrar que si A es una matriz escalonada por renglones, entonces ran- 
go (A) es igual al número de renglones no nulos de A. 


= -2 

= 2 

= 0 
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6. Si (A | B) es una matriz escalonada por renglones, demostrar que Á tam- 
bién es escalonada por renglones. 

7. Demostrar el Teorema 3.13 para matrices de una sola columna. 

8. Demostrar el Teorema 3.13 de la manera siguiente. Sea A una matriz de 
n x n de rango r. Como el resultado es inmediato para r — 0, supóngase 
r > 0. Sea la base ordenada estándiar para F n , defínase = L{l Á (ei), 
l A (e 2 ), . .. , L A (ek)} para 1 < k < n y defínase kj — min{/: dim(Wi) = 
/} para 1 < / < r. Demostrar que k x < k 2 < ... < k r y que k, > / para 
toda /. Sea Zj = L A (e fc ), y demostrar que {z u z*,. .z,} es linealmente 
independiente. Extender este conjunto a una base /?' para F ,n . Hacer = 
[L A Y fi ' y demostrar lo siguiente: 

(a) B — CA para alguna matriz invertible C de m x atc. 

(b) B es escalonada por renglones. 

(c) B se puede obtener a partir de A mediante un número finito de ope- 
raciones elementales con renglones. 

9. (a) Demostrar que si Q y Q' son matrices de m x n escalonadas por ren- 

glones tales que Q puede ser transformada en Q' por medio de un 
número finito de operaciones elementales con rengíones, entonces 
Q = Q'. Sugerencias: Emplear inducción sobre n. 

(b) Deducir que si A es cualquier matriz, entonces existe una única ma- 
triz escalonada por renglones que puede obtenerse a partir de A 
mediante un número finito de operaciones elementales con renglones. 
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Determinantes 


Durante un tiempo los determinantes jugaron un papel fundamental en el 
estudio del álgebra lineal; ahora, sin embargo, tienen una importancia mu- 
cho menor. Veremos, de hecho, que virtualmente nuestra única utilizacion 
de los determinantes será en el cálculo de los “eigenvalores”. Por esta razón 
las cuestiones más importantes que serán necesarias para los próximos 
capítulos se resumen en la Sección 4.5, de manera que el lector que no 
esté interesado en seguir un desarrollo de la teoría de los determinantes 
podrá pasar inmediatamente a dicha sección. 

E1 determinante de una matriz cuadrada con elementos de un campo F 
es un escalar (elemento de F ), por lo que podemos considerar al deter- 
minante como una función cuyo dominio es M nxn (F) y que toma valores 
de F. Aun cuando el determinante de una matriz cuadrada pueda ser 
definido en términos de los elementos de la matriz, la definición resultante 
es comprometedora para ser utilizada en operaciones. En vez de definir 
el determinante de esta manera, en la Sección 4.2 definiremos al determi- 
nante como una función S: M,, xr , (F) —> F que tiene tres propiedades 
importantes. En dicha sección también verificaremos que el método corrien- 
te para evaluar un determinante mediante la expansión a lo largo de una 
columna es, de hecho, un determinante en el sentido de nuestra defini- 
ción. La Sección 4.3 contiene otras propiedades adicionales de los determi- 
nantes y demuestra que existe un determinante único en M nxn (F), es decir, 
que las tres propiedades que definen un determmante son satisfechas por 
una y sólo una función de M nxn (F) en F. La Sección 4.4 utiliza los deter- 
minantes para encontrar la inversa de una matriz invertible y para resolver 
un sistema de ecuaciones lineales que posee una matriz de coeficientes 
invertibles por medio de la regla de Cramer. 

E1 capítulo principia con una exposición de la teoría general en una 
forma sencilla. En esta sección investigaremos también el significado geo- 
métrico de los determinantes en términos de área y orientación. Los lectores 
que hayan estudiado cálculo avanzado recordarán que un cambio de 
coordenadas en las integrales múltiples requería del uso de un determi- 
nante llamado jacobiano. 
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4.1 DETERMINANTES DE ORDEN 2 

Algunas veces asignaremos a toda matriz de n x n con elementos de un 
campo F un escalar llamado “el determinante” de la matriz, pero primero 
consideraremos un caso especial fácil. 

Definición. El determinante de una maîriz A de 2 x 2 con elementos de un 
carnpo F es el escalar AnA 22 — A 12 A 21 , que denotaremos por det(A). 

Ejemplo 1. Considérese el siguiente elemento de AA 2x2 (7?): 



Entonces 


det (A) = 1 -4 - 2 -3 = -2. 

En la exposición siguiente será conveniente representar una matriz A 
de 2 x 2 en términos de sus renglones; como anteriormente, escribiremos 



y representaremos su determinante mediante 


det U0- 

E1 determinante tiene las siguientes propiedades importantes. 


Teorema 4.1. El determincmte de una matriz de 2 x 2 satisface las tres condi- 
ciones siguientes: 


(a) El determinante es una función lineal fle cada renglón cuando 
el otro renglón permanece fijo; esto es, 


(b) 

(c) 


y 


d “{ CA ‘A, =c *'(a0 + *'(aÍ) 
Je ‘ {cA^l Al) = 0 d “ (a!) + J “ (A') 


para todo escalar c en F. 

Si AÇM 2x2 (F) tiene renglones idénticos, entonces det(A) = 0. 
Si I es la matriz identidad de 2x2, entonces det(l) = 1. 


DEMOSTRACIÓN. 
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entonces 


det 


( CA, a A ' 



+ A' 


cA + A' \ 
12 12 \ 

A 22 J 


= icA u + (cA ls + A\ t )A n 

= - xa,> + - a :, a .) 


=cde, C+: +::) +de, (+i: S) 

= cde. (^)+*t(^;). 


Un argumento semejante demuestra que el determinante es también una 
función lineal del segundo renglón. 

(b) Si los renglones de A son idénticos, entonces A tiene la forma 

f A u A 12 \ 

\/4n A 12 J 

Así, det (A) — A^A 12 - A ì2 A n = 0. 

(c) Puesto que 


I = 



det (/) = 11 —00 = 1. ■ 


E1 siguiente resultado muestra que las tres propiedades mencionadas 
en el Teorema 4.1 caracterizan completamente a-1 determinante tal como 
se definió anteriormente. 

Teorema 4.2. Sea 8: M 2x2 (F) —> F una función cualquiera que ienga las ires 
propiedades siguientes: 

(a) 8 es una función lineal de cada renglón cuando el otro renglón 
se mantiene fijo. 

(b) Si A ÇM 2x2 (F) tiene rengiones idénticos, entonces S(A) = 0. 

(c) Si I es la matriz identidad de 2 x 2, entonces S(I) = 1. 

Entonces 8 — det; esto es, S(A) = A U A : , 2 — A 12 A 2 i para toda AÇM 2x2 (F). 
demostración. Sea / la matriz identidad de 2 x 2 y sean 



Obsérvese que S(Mi) — S(M 2 ) ~ 0 de acuerdo con la propiedad (b). 
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Primero demostraremos que S(M 3 ) = — 1. Utilizando las propiedades (b) 
y (a) tenemos 


—0 0 -(r •!') 

■C 1) 


1 0 
1 1 


= 8 (o + i i + 0 ) + 8 (o+i ì + o) 

= 8 (o î) +8 (i o) +8 (o î) +8 (? o) 


= 8 (/) + 8(M J + 8(M 2 ) + 8 (M a ) 

= 1 + 0 + 0 + 8(M 3 ). 

Luego, entonces 8(M 3 ) = —1. 

Ahora sea A un elemento cualquiera de M 2 x 2 (F); entonces 

f A tl + 0 0 + A 12 ■ 

A 21 A 22 


!:)=• (' 

=s (^” Z) +s (Z Z) 


■) 


= 8 í Al1 ° ) + 8 f 0 Al2 ) 

yO + ^21 A 2 2 + 0/ \0 + y4 2 i A 22 + 0 J 

= s ( A o D + s (a! o) + 8 (o a!) + s (L A o) 


AuA 2 


+ +12+21 


.= 8 (J ï) 
8 G i) 


+ A ìiA 2i * S 


(l °o) +A ^i°o l) 


= A U A 22 • 8(1) + A u A 21 * S(Mj) + A 12 A 22 • 8(M 2 ) + ì 4 12 + 4 2 i * 8(M S ) 
= A 1 X A 22 ( 1 ) + A u A 2 i(0) + A i 2 A 22 ( 0 ) + A ì2 A 2 i ( — 1 ) 

— AuA 22 A 1 2 A 2 i = det(/4). 


Y, por tanto, 8 = det. ■ 

Motivados por esta caracterización del determinante de una matriz 
de 2 x2, en la Sección 4.2 definiremos un determinante en M nxîl (F) 
como una función que posee las tres propiedades del Teorema 4.1. Pero 
primero veremos esta propiedad de unicidad para estudiar el significado 
geométrico del determinante de una matriz de 2 x 2. En particular, encon- 
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traremos que el signo del determinante es de importancia geométrica en 
el estudio de ìa orientación. 

A1 hablar del ângido entre dos vectores en R 2 , se entiende que hablamos 
del ángulo 0, tal que 0 < 0 < ir, formado jx>r los vectores de la misma 
magnitud y dimensión que los vectores dadós pero que parten del origen. 
(Véase Fig. 4.1.) Dados tres vectores u, v y w que parten del mismo pun- 
to, se dice que v está ubicado entre u y w si el ángulo entre u y w es 
igual a la suma de los ángulos entre u y v y entre v y w. (Véase Fig. 4.2.) 

Dada una base ordenada fi - {u, v} para R 2 , donde u = (a u a 2 ) y 
v = (b u b 2 ) denotamos por 

det ( U ') 

al escalar lvJ 




Angulo entre dos 
vectores en R 2 

figura 4.1 


x 




v se encuentra entre u y vv. v no se encuentra entre u y w. 

(Aquí w se encuentra entre u 
y v.) 

figura 4.2 


y definimos la orientación de p como el número real 
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(Se deduce del Ejercicio 10 que el denominador no es cero.) Claramente 



Obsérvese que 

°(«;) =i y o (4)=-‘- 

En general (véase el Ejercicio 11), 



si y sólo si la base ordenada {u, v} forma un sistema coordenado dere- 
cho, y 

°(“)=-' 

si y sólo si [u, v} forma un sistema coordenado izquierdo. (Recuérdese que 
un sistema coordenado {u, v} es derecho si u puede hacerse coincidir 
con v haciéndolo girar en contra de las manecillas del reloj un ángulo 0 
tal que 0 < 0 < x; de lo contrario {u, v} es un sistema coordenado iz- 
quierdo. Véase Fig. 4.3.) Por conveniencia, definimos 

°(“)=° 

si {u, v} es linealmente dependiente. 



Un sistema coordenado derecho Un sistema coordenado izquierdo 

figura 4.3 

Cualquier conjunto ordenado {u, v} en R 2 determina de la siguiente 
manera un paralelogramo. Considerando a u y a v como flechas que 
parten del origen de R 2 , llamamos al paralelogramo que tiene a u y a v 
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como lados adyacentes el paralelogramo determinado por u y v (véase 
Fig. 4.4). 



Paralelogramos determinados por u y v 

figura 4.4 

Obsérvese que si el conjunto {u, v} es linealmente dependiente, es 
decir, si u y v son paralelos, el “paralelogramo” determinado por u y v 
es en realidad un segmento de recta que podemos considerar como un 
paralelogramo degenerado cuya área es cero. 

Existe una relación interesante entre 



el área del paralelogramo determinado por u y v, y 



que ahora procederemos a investigar. Sin embargo, obsérvese primero que 
como 



puede ser negativo, no podemos esperar que 



Pero podemos demostrar que 



de donde se tiene que 
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Con el argumento de que 



utilizaremos una técnica que, aun cuando algo indirecta, podrá ser gene- 
ralizada para R n . Puesto que 


°(“)- ±i ’ 

podemos multiplicar ambos lados de la ecuación deseada por 


°(“) 

para obtener la forma equivalente 

°(“)' A (“)- et C)- 

Estableceremos esta ecuación verificando que las tres condiciones del 
Teorema 4.2 se satisfacen por la función 



(a) Principiaremos demostrando que 

•(:)—(:> 

Obsérvese que esta conclusión es inmediata si X = 0 puesto que 


•U) _0 (í)- A (3)- a 

Supóngase entonces que X^O. Considerando a Xv como la base del para- 
lelogramo determinado por u y Av, vemos que 


A 



= base x altura = | X |(longitud de v) (altura) = | X |/ A 



puesto que la altura h del paralelogramo determinado por u y Xv, es la 
misma que la del paralelogramo determinado por u y v. (Véase Fig. 4.5.) 
De aquí que 


S 



- °(“)]D a|a (“)] 

0 - 
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Un argumento semejante muestra que 



Demostraremos a continuación que 


8 


( u 
\au + bw 


) 



para toda u, w£R ! y todo número real a y b. Obsérvese que debido a 
que los paralelogramos determinados por u y w y por u y u + w tienen 
una base común u y la misma altura (véase Fig. 4.6), 



a( u ) =a( U V 

J yu + w J 

Si a — 0, entonces 

s U“<-) =î W =i " 8 (-) 

de acuerdo con el primer párrafo de la parte (a). De lo contrario, si 
a / 0, entonces 

8 (a« + bw) = a ‘ 8 (« + b -w) ” 8 (V) _ b ' 8 (w)* 

Y así se obtiene la condición deseada en ambos casos. 
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Ahora podremos demostrar que 

S (v,“v,) =8 (“) +8 (“) 

para toda u, v 1; v 2 £ R 2 . Como el resultado es inmediato si u = 0, supon- 
dremos que u 0. Tómese cualquier vector w £ R 2 tal que {«, vv} sea 
linealmente independiente. Entonces, para vectores cualesquiera v„ 
v 2 £R 2 , existen escalares a; y b f tales que vj = a,u + b,w(i — 1, 2). En- 
tonces 

8 ( “ ) = 8 f , “ ,, , , . ) = (b, + b 2 ) 8 ( 

\v t + v 2 J \(a! + a 2 )u + (bi + b 2 )w) \w) 

= 8 ( “ ì+sf “ 

\aiU + b{w) \a 2 u + b 2 w J \ v i J \ V -J 

Un argumento semejante muestra que 

s (“':“-)='(“;) +8 (v) 

para todo u u u 2ì vÇR 2 . 

(b) Como 

a C)=». s (r,)=»=°(“) A (») 

para toda u £ R 2 . 

(c) Como el paralelogramo definido por e x y e 2 es el cuadrado uni- 
tario, 

8 G;H=°0;) A 0;> 

Por tanto, 8 satisface las tres condiciones del Teorema 4.2 y 8 = det. 
Así, el área del paralelogramo determinado por u y v es igual a 



Entonces, por ejemplo, se ve que el área del paralelogramo determi- 
nado por u — (~1, 5) y v — (4, —2) es 

-OH-CÌ 4)1 = 18 - 

EJERCICIOS 

1. Decir si las siguientes afirmaciones son falsas o verdaderas. 

(a) E1 determinante de una matriz de 2 x 2 es una función lineal de 
cada renglón de la matriz cuando el otro renglón se mantiene fijo. 

(b) Si I es la matriz identidad de 2 x 2, entonces det(7) = 0. 
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(c) Si ambos renglones de una matriz A de 2 x 2 son idénticos, enton- 
ces det(/4) = 0. 

(d) Si u y v son vectores en R 2 que parten del origen, entonces el área del 
paralelogramo que tiene a u y v como lados adyacentes es 

*•(:)■ 

(e) Un sistema coordenado { u , v} es derecho si y sólo si su orientación 
es 1. 

(f) E1 determinante es una transformación lineal de M 2x2 (E) en F. 

2 . Calcular los determinantes de los siguientes elementos de M 2X 2 (F): 

(a) ^6 — 3^ (b) ^ —5 2j (c) (8 

3 . Calcular los determinantes de los siguientes elementos de M 2X 2 (C): 

(a) f-l+i 1 — 4í\ (b) ( 5-2 i 6 + 4A (c) /2 i 3\ 

{ 3 + 2 / 2-3// \-3 + i li ) \4 6 i) 

4 . Para cada uno de los siguientes pares de vectores u y v en R 2 , calcule el 
área del paralelogramo determinado por u y v. 

(a) w - (3, -2) y v= (2, 5) 

(b) « = (1, 3) y v = (-3, 1) 

(c) «= (4, -1) y v - (-6, -2) 

(d) u=( 3, 4) y v= (2, -6) 

5. Demostrar que si # es la matriz obtenida al intercambiar los renglones de 
una matriz A de 2 x 2, entonces det(F) = —det(/4). 

6 . Demostrar que para cualquier A €M 2x2 (F), det (A*) = det(/t). 

7 . Demostrar que si A es una matriz triangular de 2 x 2, entonces el deter- 
minante de A es igual al producto de los elementos de A situados en la 
diagonal. 

8. Demostrar que para cualesquiera A , #ÇM 2x2 (F), det(AB) = det(A) * 
det(F). 

9. La adjunta clásica de una matriz A de 2 x 2 es la matriz 



Demostrar que la adjunta clásica de una matriz posee las siguientes pro- 
piedades: 

(a) (adj A)A = ^(adj A) = [det (A)]I. 

(b) det(adj A) = det(^). 

(c) adj A l = (adj /4)V 
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10 . Utilizando al Ejercicio 9(a), demostrar que una matriz A de 2 x 2 es 

invertible si y sólo si det(A ) 0, y que en este caso A' 1 = [det(/4)] _1 

X (adj A). 

11. Demostrar que 



si y sólo si la base ordenada {«, v} para R 2 forma un sistema coordenado 
derecho. Sugerencia: Recordar la definición de una rotación dada en el 
Ejemplo 5 de la Sección 2.1. 


4.2 DETERMINANTES DE ORDEN n 

Hemos visto en el Teorema 4.2 que el determinante de una matriz de 
2 x 2 se caracteriza totalmente por tres propiedades. Definiremos pronto 
el determinante de una matriz de n x n en términos de esas propiedades, 
pero primero necesitaremos de algunos resultados preliminares. Para co- 
menzar definiremos la primera de las condiciones que caracterizaron al 
determinante de ima matriz de 2 x 2. 


Definición. Una función 8: M nxn (F) F se dice que es una función ra-lineal 
si 8 es una función lineal de cada renglón de una matriz de n x n cuando 
los restantes n — 1 renglones se mantienen fijos, esto es, si 


( A ' ) 


(AA 


/aa 

ô cAi -f- A[ 

= c-<5 

A, 

+ ô 

a; 

< A n J 


\A q / 


\A n / 


siempre y cuando 

( Al \ 


, para i = 1, 2,.. ., n 


cAi -|- A[ 


\ A n / 


sea un elemento de M ûxn (F). 
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Ejemplo 2. E1 Teorema 4.1 muestra que det: M 2)<2 (F) -> F definido 
por det(/l) = A n A 22 — A 12 A 21 es una función 2-lineal. 

Ejemplo 3. La función 8: M nxn (F)->F definida por S(A) = 0 para 
toda A 6M nxn (F) es una función n-lineal. 

Ejemplo 4. La función 8: M nxn (F) -> F definida mediante S(A) = 
A \jA 2 j ... A nj (esto es S(A) es igual al producto de todos los elementos 
de la /-ésima columna de A) es una función n-lineal para cada /(1 < / < n) 
puesto que 


( \ 


cA t + A t 


\ A . ) 


A\j • • • A {t - x) j(cA t j + • • *A hJ 


— c (A\j • • • A tJ • • • A„j ) + (A\j • • • Acf-DjA'fjAu+Dj • • • A hJ ) 



MA 


MA 

c*Ô 

A t 

+ <5 

Aí 


w 


\aJ 


Ejemplo 5. La función 6: M nxll (F)->F definida mediante 8(^) = 
A X1 A 2 2 ... A nn (esto es, $(A) es igual al producto de los elementos de A 
ubicados sobre la diagonal) es una función n-lineal. 

Ejemplo 6. La función 8: M nxn (F)-»F definida por 8(^4) = tr(^4) 
no es una función n-lineal. 

Nuestro siguiente resultado muestra que las funciones n-lineales pue- 
den combinarse para producir otras funciones n-lineales. 

Teorema 4.3. Una combinación lineal de dos funciones n-lineales es una fun - 
ción n-lineal (donde la suma y la multiplicación por escalares son como se 
definieron en el Ejemplo 3 de ïa Sección 1.2), 
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demostración. Sean §! y S 2 funciones n-lineales y sean a y b escalares. 
Si S es la combinación lineal S = aS^ + bS 2 , entonces 



Entonces S es una función n-lineal. ■ 


Coro/ar/o. Cualquier combinación lineal de funciones n-lineales es una función 
n -iineal. 

dem os t ración . E j er cicio. 

La siguiente definición hace mención de ia segunda de las tres propie- 
dades que caracterizaron al determinante de una matriz de 2 x 2. 
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Definición. Se dice que una función 8 n-lineal es alternanîe si 8(A) = 0 siem- 
pre que dos renglones adyacentes sean idénticos. 

Ejemplo 7. De las tres funciones n-lineales dadas en los Ejemplos 3, 
4 y 5 sólo la primera de ellas es alternante. 

E1 siguiente resultado muestra que la definición anterior es más pode- 
rosa de lo que parece. En particular, no hay necesidad de que los 
renglones en la definición se supongan adyacentes. 

Teorema 4.4. Sea S: M nxll (F)—»F una función n-lineal alternante. Entonces 
son ciertas las siguientes expresiones: 

(a) Sì B se obtiene al intercambiar cualquier par de rengîones en 
una matriz A de n x n, entonces 8(B) = — 8(A). 

(b) Si dos renglones de una matriz de n x n son idénticos, entonces 
8(A) = 0. 

demostración. Demostraremos primero que si B se obtiene al intercam- 
biar cualquier par de renglones adyacentes de A entonces 8(B) = — 8M). 
Supóngase que B se obtiene al intercambiar los renglones / e / + 1 de 


h\ 


/A> \ 

A, 

A ,+1 

; entonces B — 

A ,+1 
A, 

\A n ì 


U i 


Ahora bien 


/ * \ 


o = á 


A t + A i+1 
At + A i+ 1 


/: \ 




A, 

A { + A i+1 


+ ^ 


u ! \ / 


/ ^ \ 


A i+1 

Ai + A i+1 


\ A n J 
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(M 


( A : \ 


A\ \ 


l A : \ 

s À ' 

+ ô 

A, 

+ (î 

Ai+ 1 

+ à 

^i+i 



^i+í 




At+ 1 

\A n ì 


U í 


\A„ ì 




= 0 + Ô(A) + S(B) + 0 


porque 8 es una función n-lineal alternante. Así, 8 (B) = —S(A). 

Ahora supóngase que B se obtiene de + intercambiando los renglones 
i y / donde i < /. Comenzando con los renglones í e i + 1, intercambia- 
mos sucesivamente los renglones de A hasta que éstos tienen el orden 
siguiente: 

Aiy • * • , A t-i, A{ + \y ... , Ajy Aj, Aj + \, . .. , A n . 

En total, se requieren / — i intercambios para producir este orden. Ahora 
intercámbiese sucesivamente Aj con el renglón anterior hasta que los 
renglones tengan el orden siguiente: 

A i, • • • , A + - 1, Aj, Aj + 1, ... , Aj-i, Aj, Aj + \, ... , A n . 

Este proceso requiere de / — i — 1 intercambios de renglones adyacentes 
y produce la matriz B. De aquí, en virtud del primer párrafo de la demos- 
tración, vemos que 

S(B) = (-l)M(-i)M-i8M) - 8(+) = -8(/4). 

Resta demostrar que si dos renglones de A son idénticos, por ejemplo 
i y / (i < /), entonces S(A) = 0. Si / = * + 1, entonces dos renglones ad- 
yacentes de + son idénticos y por hipótesis S(A) = 0. Si / > i + 1, inter- 
cámbiense los renglones i + 1 y / para obtener una matriz B con dos 
renglones adyacentes iguales. Entonces S(B) = 0, pero como S(B) = 
~S(A) de acuerdo con el segundo párrafo de Ia demostración, se tiene 
que 8(+) — 0. De este modo 8 satisface las condiciones (a) y (b). ■ 

Estamos preparados ahora para definir im determinante en M mxn (F). 
Obsérvese que el determinante se define en términos de las tres propieda- 
des del Teorema 4.2 que caracterizan al determinante de una matriz de 
2x2. 


Definición. Urt determinante en M nxn (F) es una función alternante n-lineal 
8: M nxn (F) —» F tal que 8(1) = 1. 

Un ejemplo sencillo de determinante puede darse en M lxl (F), para la 
función 8: M lxl (F) F definida por S(A) = A X1 (el único elemento 
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de A), que claramente satisface los requisitos de esta definición. Mas aún, 
el Teorema 4.1 muestra que al definir el determinante de una matriz A 
de 2 x 2 como A lt A 22 - A 12 A 21 se obtiene un determinante en M 2x2 (F) 
en el sentido de la definición anterior. Nuestro siguiente resultado nos 
autoriza a definir un determinante en M n xn(F) por induccion para cual- 
quier n > 3. 

Teorema 4.5. Sea S una funeión n-lineal alternante en M nxn (F). Para cada 
matriz A de (n + 1) x (n + 1) y para cada j(l < j < n + 1), se define 

6i(A) = çViy+'A,,. *(*„), 

donde Aìj es la matriz de n x n obtenida a partir de A eliminando el 
ì-ésimo rengîón y la yésima columna. Entonces 6 j es una función (n + 
1 )-lineal alternante en las matrices de (n + 1) X (n + 1) con elementos 
de F. 

demostración. Como À\j se obtiene a partir de A al suprimir el i-ésimo 
renglón y la j-é sima columna, S(/Íìj) es independiente del í-ésimo ren- 
glón de A. Entonces, como 8 es una función rt-lineal S(Àij) es una fundón 
lineal de cada renglón de A a excepción del renglón i. Por tanto A {j • S(+ì;) 
es xma función (rt + l)-lineal de las matrices de (rt+ 1) x (n + 1) con 
elementos de F. Entonces, como 

n+ 1 

e f (A) = 2 (-iy +i A ir s(Àij) 

i = 1 

es una combinadón lineal de las fundones (n + l)-lineales Aij S(Âa), 
ç,- es una función (« + l)-lineal en virtud del corolario del Teore- 

ma 4.3. 

Demostraremos ahora que €# es alternante. Supóngase que A es una 
matriz de (n + 1) X (n + 1) en la que los renglones k y k+l son 
idénticos. Entonces Âa tiene dos renglones idénticos siempre que i ^ k e 
i =/= k + 1. Así S(Âij) = 0 siempre que i^k e i=£k + 1 y entonces 

£ f (A) = (-ì) k *’A k j • S(Â k j) + ( — 1) (S+1)+ M(*,.!),• • Síxíífc+ni). 

Pero como los renglones k y k + 1 de A son iguales, A kj = A, k+1)j y 
Â ki = Â ( k + vi. I>e aquí que €,(+)= 0, lo que demuestra que € ; es al- 
temante. ■ 

Corofario I. Sean S y 6j como en el enunciado del Teorema 4.5. Si S es un 
determinante en M n * n (F), entonces £, es un determinante en las matrices 
de (n + 1) X (n + 1) con elementos de F. 

demostración. Sea I la matriz identidad de (n+l)x(«+l) y sea 
/ la matriz de n x « obtenida a partir de I al suprimir el renglón i y 



202 Determinante s 


la columna /. Entonces /' fj es la matriz identidad de n x n. Como / i; = 0 
si i ì e Ijj = 1, tenemos 

€,(/) -'f(-l)%-í(/ t/ ) = (-1)^ •*(/„) 

î = 1 

= 8 ( 4 ) = 1 

debido a que 8 es un determinante en M nxn (F). Entonces € ; es un deter- 
minante en las matrices de (n + 1) x (n + 1) con elementos de F. ■ 

Corolario 2. Existe un determinante en M„ * n (F) para todo entero positivo n. 

demostración. La demostración será por inducción sobre n. Si n = 1, 
la función det: M lxl (F) — > F definida mediante det(/4) = A 1X es un de- 
terminante en M lxl (F). Supóngase que existe un determinante 8 en 
Mnx n (F). Entonces para alguna /(1 < / < n + 1), la función defini- 
da en el Teorema 4.5 es un determinante en las matrices de (n + 1) x 
(n + 1) con elementos de F. Esto completa la inducción. ■ 

Definiciones. Si 8 es un determinante en M llxm (F), entonces el determinante 

fi(A)=g(-l )'+*„.#£„) 

definido en el Teorema 4.5 se llama la expansión de A a lo Iargo de la 
/-ésima columna. El escalar (— l) 1+i .á(Â u ) se llama el cofactor de A|j 
(con respecto al determinante 8). 

Ejemplo 8. Sea A el siguiente elemento de M 3x3 (F): 

1 2 3\ 

4 5 6 . 

7 8 9/ 

Los cofactores de A, 2 , A 22 y A 32 son, respectivamente, 

(— 1) 1+2 det ^ = ( — 1) (4 9 ~ 6-7) = 6, 

( —l) 2+2 det^* ^ = 1(1 -9 - 3-7) = -12, 

( — 1) 3+2 det ^ gj = ( — 1) (1 - 6 — 3 - 4) = 6. 

Por tanto, la expansión de A sobre la segunda columna es 

€ 2 (+) = A 12 ( 6) + A 22 (-12) + A :í2 ( 6) 

= 2 - 6 + 5 ( — 12 ) + 8-6 = 0 . 
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De la misma manera, los cofactores de A 13 , A 23 y A 33 son, respectivamente, 
( —1 ) 1+3 det (tj l^= 1(4-8-5-7) = -3, 

(-l)«det^ 3 )= (-1)0-8-2-7) = 6 , 
( _l)3 + 3 d et^ ^ = 1(1-5 - 2-4) = -3. 

De aquí que la expansión de A a lo largo de la tercera columna es 

Ç t (A) = A 13 ( — 3) + A 23 (6) + A 33 ( —3) = 3 ( 3) + 6(6) + 

+ 9( —3) = 0. 

Veremos en el Teorema 4.9 que la igualdad de Ç. 2 (A) y C 3 (^) en 
el Ejemplo 8 no es coincidencia. De hecho, veremos que existe exactamen- 
te un determinante en M nxll (F). 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Un determinante en M U)< „(F) es una función lineal de cada renglón 
de una matriz de n x n con elementos de F cuando el resto de los 
n — 1 renglones permanece fijo. 

(b) Si 8 es un determinante y cualquier par de renglones de A son idén- 
ticos, entonces 8 (A) = 0. 

(c) Sea S un determinante. Si B es una matriz obtenida a partir de A 
intercambiando dos renglones cualesquiera entonces S(/4) = 8 (fl). 

(d) La función 8 : M ftxB (F)-»F definida por S(A) = 0 para toda 

A £M„ XI „(F) es un determinante en M„ XI 1 (F). 

(e) Para cualquier n>2 existe un determinante en M„,<„(F). 

(f) Cualquier determinante 8 : M nx „(F) —>F es lineal. 

2. Verificar que si A es la matriz de 3 x 3 del Ejemplo 8, entonces la expan- 

sión de A a lo largo de la primera columna es igual a cero. 

3. Evaluar el determinante de cada una de las siguientes matrices por expan- 

sión sobre la segunda y la tercera columna. (Cada matriz es un elemento de 
M,«.(C).) 

(a) 1-3 2 5\ (b) /8-4 0\ 

( 1 0 -lj 0 6 -3 

\ 4 —6 7/ \-l 5 2/ 



204 Determinantes 


(c) /1 2 

" 5 \ 

(d) /l+i -1 

° \ 

6 -4 

3 

2 3/ 

4/ ) 

\o 1 

1/ 

\ 0 2 - / 

-1 + 2/7 

^Cuáles de las 

siguientes funciones 8 

: AA 3X 3 (F) —> F son 

funciones 3-linea- 


les? Justificar cada respuesta. 

(a) 804) = c, donde c es cualquier escalar no nulo 

(b) 8(A)=A 22 

(C) $(A) = A uA 23A 32 

(d) 8(A) = A nA 21A 32 

(e) à(A) = A nA 31 A 32 

(f) 8(A) = A*A\A* 

(g) 8(i4) — A\-yA 22 A 33 A\\A 2 lA 32 

5. (a) Determinar todas las funciones 1-lineales 8: M lx i(F) —»F. 

(b) Determinar todos los determinantes en M lxl (F). 

6. Demostrar la igualdad de las tres funciones M 3 x 3 (F) F(j = 1, 2, 3) 
definidas en el Teorema 4.5 para toda A £M 3 x 3 (F) por 

6 / 04 ) = 2 ( — l) i+f Aij • det(Âij), 

i — 1 

donde Â iý - es la matriz de 2 x 2 obtenida a partir de A suprimiendo el 
renglón i y -la columna / y det denota el determinante unico en M 2 x 2 (F). 

7. Demostrar que el determinante único en M 2 x 2 (F) es una función 2-lineal 
de las columnas de una matriz de 2 x 2 y que el determinante de una 
matriz de 2 x 2 , en la que ambas columnas son idénticas, es cero. 

8 . La demostración del Teorema 4.2 muestra que si 8 es una función 2-lineal 
8 : M 2 x 2 (F) —> F, entonces 

8 (A ) — AuA^z * 8(1) + AiiA 2 i ‘ 8 (Aíi) + 

+ A i 2 /4 22 * 8 (M 2 ) + A 12 A 21 * 8(A 3 ), 

donde /, M u M 2 y M s son como en la demostración del teorema. Demos- 
trar que para escalares cualesquiera a, b, c, d£F la función 

6 (A) = AuA 22 a + AuA 2 ib + Ai 2 A 22 c + Ai 2 A 2 id 

es 2-lineal. Entonces 8 ': M 2 x 2 (F) -> F es una función 2-lineal si y sólo si 
es de la forma anterior para algunos escalares a, b, c y d. 

9. Demostrar que si F no es un campo de característica dos (tal como se 
define en el Apéndice D), entonces la condición (a) del Teorema 4.4 im- 
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plica la condidón (b) del mismo. Sin embargo, el resultado no es verídico 
en campos arbitrarios. 

10 . Demostrar el corolario del Teorema 4.3. 


4.3 PROPIEDADES DE LOS DETERMINANTES 

Existen varias propiedades importantes que son de gran utilidad al evaluar 
un determinante de ima matriz dada. Estas se resumen en el siguiente 
teorema. 

Teorema 4.6. Cualquier determinante 8 en M nxn (F) tiene las siguientes pro- 
piedades: 

(a) Si B es una matriz obtenida a partir de A al multiplicar cada 
elemento de un núsmo renglón de A por un escalar c, entonces 
8(B) = c* 8(A). 

(b) Si dos renglones de A son idénticos, entonces 8 (A) — 0. 

(c) Si B es una matriz obtenida a partir de A intercambiando dos 
renglones, entonces S(B) — — 8 (A). 

(d) Si un renglón de A consta totalmente de elementos nulos, en - 
tonces S(A) — 0. 

(e) Si B es una matriz obtenida a partir de A al sumar un múltiplo 
del renglôn i al renglón j(i^j), entonces 8(B) = 8(A). 

demostración. La propiedad (a) es una consecuencia del hecho de que 
8 es una fundón nA ineal, mientras que ias propiedades (b) y (c) son 
consecuendas del Teorema 4.4. 

(d) Supóngase que A iy el renglón / de A, consta totalmente de ele- 
mentos nulos. Entonces 



AA 


MA 

II 

__ 

0 A, 

— 0-ô 

At 


\aJ 


\A.j 


(e) Sea B obtenida a partir de A ÇM nxn (F) sumando c veces el ren- 
glón / al renglón /. Supongase por razones de argumento que / < /. Por 
tanto, si 
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por la n-linealidad de 8 y por la propiedad anterior (b). ■ 

Obsérvese que las propiedades (a), (c) y (e) del Teorema 4.6 mues- 
tran cómo cambia el determinante de una matriz cuando se realiza en la 
matriz una operación elemental en los renglones. Podemos reformular estas 
propiedades en términos de matrices elementales de la manera siguiente. 

Corofar/o. Sean E u E, y E 3 matrices elementales en M lltX!1 (F) respectivamente 
de los tipos 1, 2 y 3. Si E 2 se obtiene multiplicando un renglón de I por 
el escaiar no nulo c, entonces para cualquier determinante 8 en M nxn (F), 
8(Ei) = -1, S(E 2 ) = c, y 8E a ) = 1. 

Este corolario es uno de los ingredientes clave de la demostración de 
la unicidad de un determinante en M nxn (F). Demostraremos ahora los dos 
teoremas restantes que serán necesarios para establecer la unicidad. Nues- 
tro primer resultado calcula el determinante de cualquier matriz no in- 
vertible. 

Teorema 4.7. Sea 8 un determinante en M nxn (F) y sea A un elemento de 
M nxn (F) de rango menor que n. Entonces S(A) = 0. 



Propiedades de los determinantes 207 


demostración. Como rango(/4) < n, los renglones de A son linealmen- 
te dependientes (Corolario 2 del Teorema 3.5). Por tanto existen escalares 
c,, ... , c„, no todos cero, tales que c,A , + c,A-, + . .. + c n A„ = 0, don- 
de +!, A 2 , ... , +„ son los renglones de A. Supóngase en favor del argu- 
mento que c, ^ 0; entonces 

+ + cr’c A + . .. + c-'c A = 0. 

i 12 2 i n n 

Sea B la matriz obtenida a partir de A sumando al primer renglón el múl- 
tiplo cr'c.A . del renglón i para toda i(i = 2,. . n). Entonces el primer 

renglón de B consta totalmente de elementos nulos, de modo que 8(B) — 0. 
Pero S(B) = 8(A) de acuerdo con la propiedad (e) del Teorema 4.6. 
Por tanto 8(A) = 0. ■ 

E1 siguiente resultado establece el hecho final necesario para demos- 
trar la unicidad de un determinante en M, lxn (F),que un determinante se 
comporta adecuadamente respecto a la multiplicación matricial. Sin em- 
bargo, este teorema es de considerable importancia por su propio derecho. 
En espedal su segundo corolario, que proporciona una prueba determi- 
nante para la invertibilidad de una matriz, será utilizado con frecuencia 
en los próximos capítulos. 

Lema . Si E es una maîriz elemental de n x n con elementos de F y si 8 es un 
determinante en M nxn (F), entonces 8(EB) — 8(E) • 8(B) para cualquier 
B €M nxn (F). 

demostración. Supóngase que al multiplicar por la izquierda por E se 
intercambian dos renglones de B. Entonces 8(EB) = —8(B) de acuerdo 
con el Teorema 4.6(c). Pero 8(E) = — 1 por el corolario al Teorema 4.6; 
entonces 8(EB) = 8(E) ’8(B). Demostraciones semejantes establecen el 
resultado para la multiplicación de un renglón de B por un escalar no nulo 
o para la suma de un múltiplo de un renglón a otro. ■ 

Teorema 4.8. Sea 8 un determinante en M nxn (F), y sean A y B elementos 
cualesquiera de M nxn (F). Entonces S(AB) — S(A) *8(B). 

demostración. Si rango(,4) < n, entonces de acuerdo con el Teore- 
ma 3.6 rango(/4B) < rango(>4) < n. Por tanto por el Teorema 4.7 
8 (AB) = 0 y 8(/4) = 0. Y en este caso 8(>ÍB) = 8(^4) * 8(B). 

Si rango(A) i= n, A es invertible y por tanto es el resultado del 
producto de matrices elementales (Corolario 3 del Teorema 3.5). Sea 
A = E m . .. E u donde cada E x es una matriz elemental. Entonces por el 
lema tenemos 

8(AB) = 8(E m . . . E,B) = 8(E m ) • 8(E m ^ . . . E,B) .= . . . 

= 8 (E m ) • . . . • S(E,) • 8(B) = 8 (E m . . . E x ) ■ 8(B) = 8(A) • 8(B). U 
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Coro/crr/o 7. Sea 8 un determinante en M nxn (F), y sea AÇM nxn (F) invertible . 
Entonces 8( A) ^Oy «(A" 1 ) = [8 (A)]- 1 . 

demostración. En virtud deí Teorema 4.8 se tiene que 

8(A) • 8G4- 1 ) = 8(AA~') = S(/ n ) = 1. 

De manera que 8(,4) ^Oy S^- 1 ) = [8(i4)]-\ ■ 

Corofarío 2. Sea 8 un determinante en M nxn (F) y rca AÇM nxn (F). Entonces 
las siguientes condiciones son equivalentes: 

(a) 8(A) = 0. 

(b) A no es invertible . 

(c) rango(A) < n. 

demostración. E1 corolario anterior muestra que si 804) = 0, enton- 
ces A no es invertible. E)e aquí que la condición (a) implica la condi- 
ción (b). 

E1 que la condición (b) implique la condición (c) se deriva de una 
observación previa en la página 146. 

Finalmente, el Teorema 4.7 muestra que la condición (c) implica la 
condición (a). ■ 

Se demostró en los Teoremas 4.1 y 4.2 que existe exactamente un 
determinante en M 2x2 (F). Ahora podemos demostrar im resultado seme- 
jante para IK* n (F)- 

Teorema 4.9. Existe exactamente un determinante en M nxn (F). 

demostración. La existencia de un determinante en M* ™(F) se demos- 
tró en el Corolario 2 del Teorema 4.5. 

Completaremos la demostración, estableciendo que si 8 X y 8 2 son deter- 
minantes en M nxn (F), entonces 8 ± = 8 2 . Sea A una matriz arbitraria de 
n x n con elementos de F. Si rango(^) < n entonces 8^(A) = 8 2 (A) = 0 
P°r Corolario 2 del Teorema 4.8. Si rango(^4) = n, entonces A es 
invertible y por tanto es el producto de matrices elementales (Corolario 3 
del Teorema 3.5). Sea A = E m . .. E u donde cada Ei es una matriz ele- 
mental. Como 8x(Ei) 8 2 (Eì) para cada /(1 < / < m) por el corolario 
al Teorema 4.6, 

^i(-<4) 8i(E m . . . E^) = 8i(E m ) . . . SiíZs!) 

= **(E m ) . .. 8 2 (Ex) = 8 2 (E m . . . E a ) = 8 2 (A) 

por el Teorema 4.8. Por tanto 8 X = 8 2 . ■ 

De aquí en adelante denotaremos al único determinante en M^ÍF) 
por det. 
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Corolario. Sea AÇM nxn (F). Para toda j(l < j < n) 

det(A) =Ì(-1) ,+1 A„ det(k n ), 

i = 1 

donde Â„ es la matriz de (n — 1) x (n — 1) obtenida de A al suprimir 
el renglón i y la columna j. 

Así, el determinante de una matriz de n x n puede evaluarse por ex- 
pansión sobre cualquier columna; si n > 2 la expansión resultante conten- 
drá n determinantes de matrices de (n — 1) x (n — 1). E1 determinante 
de cada una de esas matrices de (n — 1) x (n — 1) puede expandirse 
sobre cualquier columna y este proceso puede continuar hasta que una 
expansión implique únicamente determinantes de matrices de 2 x 2, que 
pueden ser evaluados mediante la expresión det(/l) — dnA 2 2 j4l2-d 2 i, 
Obsérvese sin embargo que la evaluación de det(/T„) puede evitarse 
siempre que A u — 0, pues el producto + „■ • det(/îj,) será cero indepen- 
dientemente del valor del determinante. Por tanto, es benéfico expandir 
sobre una columna que tenga tantos ceros como sea posible. Ilustraremos 
este procedimiento con dos ejemplos. 


Ejemplo 9. Sea A el siguiente elemento de M 4x4 (F): 

/1 1 0 1\ 

10 11 
0 0 11 
\l 1 1 1/ 


Para minimizar el cálculo requerido para evaluar det(/l), expandiremos 
sobre la segunda columna. Entonces 

det(/t) = ± (— l)‘ +2 A l2 .det(À n ) 

i= 1 


/i 

1 


/ l 

0 

!\ 

(—1) 1+2 *1 .detl 0 

1 

1 

+ (— l) 2+2 -0-detj 0 

1 

1 

\l 

1 

1 

\l 

1 

l/ 


/! 

0 

1\ 

/1 

0 

1\ 

1 

1 

1 

+ (—l) 4+2 -l -detj 1 

1 

1 

\l 

1 

1/ 

\o 

1 

1/ 


/1 0 1 \ 


/1 0 1\ 


= (-l)-l-0 + 0 + 0+1-l.det 1 1 1 I = detl 1 1 1 


\0 1 I/ 


\0 1 1 
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(La primera de las cuatro matrices de 3 x 3 tiene dos renglones idénticos, 
por lo que su determinante es cero.) Evaluaremos ahora el determinante 
que queda expandiendo sobre la primera columna. Entonces 


/1 0 l) 
det (A) - detí 1 1 1 

\0 1 ì) 


= (~1) 1 + I • 1 'det^j +(-l) 2+ M.detÇ 
+ (-l) 3+1 -0.detÇ 


= 1 -1 -0 + (—1)-1 •(—1) + 0 = 1. 
Ahora sea B el siguiente elemento de M 5>< 5 (7?): 


/ 1 
-2 
5 
0 

\—9 


-1 0 
0 -3 
-4 0 

3 
8 


0 0 \ 
1 6 
2 0 
0-14 
0 0 0 / 


Expandiendo sucesivamente sobre la tercera, cuarta y tercera columnas 
vemos que 

/ 1 -1 

det(5) = (—1) 2+3 .(—3).det' 5 ~ 4 


3(-l) 3+4 -4.det 



= —12*(—l) 2+3 .2-det 


= 24[1 *8 - (—1)(—9)] = 24( — 1) = -24. 


Como estos ejemplos lo sugieren, el proceso de cálculo de un deter- 
minante es a menudo tedioso aun cuando se encuentren presentes elementos 
nulos; sin elementos nulos la evaluación de un determinante por expan- 
sión sobre una columna es muy ineficiente. En vez de este procedimiento 
podemos utilizar la propiedad (e) del Teorema 4.6 para cambiar la 
matriz A en una matriz B que tenga el mismo determinante que A y que 
tenga elementos nulos en una o más columnas. Este es en esencia el 
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mismo proceso que se utilizó para reducir A a la forma escalonada. A con- 
tinuación se tienen ejemplos de esta técnica. 


Ejemplo 10. Sea A el siguiente elemento de M 4x4 (ft): 


/ 1-1 2 - 1 \ 
-3 4 1-1 

2-5-3 8 

—2 6 -4 1 


Entonces 


det(/f) 



( 1 7 - 4 \ (-2 6 \ 

detl —2 0 61 = (—l) l+2 -7-detí _ 1 

\ 4 0 —1/ 



= —7[(—2)(—1) - 6-4] = —7(—22) = 154. 


Ejemplo 11. Sea A el siguiente elemento de hA, yi (R): 

1 -1 2 1 \ 

2-1-1 4 

-4 5 -10 -6 ‘ 

3 —2 10 -1/ 

Introduciremos elementos nulos mediante el uso del Teorema 4.6(e) de 
tal modo que A se transforme en una matriz triangular superior que tenga 
el mismo determinante que A. EI determinante de la matriz triangular 
superior se calculará entonces por expansiones sucesivas sobre la primera 
columna. 


det(yl) = det 


1 

-1 

2 

l ) 


/i 

-1 2 

1\ 

2 

-1 

-1 

4 

= det 

0 

1 -5 

2 

-4 

5 

-10 

- 6 l 


0 

1 -2 

-2 

3 

-2 

10 

-li 


\0 

1 4 

-4/ 
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-1 

2 

1\ 


f 1 

-1 

2 

1\ 

0 

1 

-5 

2 

= det 

o 

1 

-5 

2 

0 

0 

3 

-4 


1 ° 

0 

3 

-4 


0 

9 

6/ 


lo 

0 

0 

6/ 


/1 -5 2 

= 1 -06« 0 3 —4 

\0 0 6 

= 1-1 - 3 - 6 = 18. 

Hasta ahora, el papel jugado por los renglones y columnas de una 
matriz en el estudio de los determinantes ha sido muy diferente —un deter- 
minante se definió como una función en M nxn (F) que satisface ciertas 
propiedades que involucran a los renglones de una matriz, mientras que la 
evaluación del determinante se lleva a cabo mediante la expansión sobre 
las columnas de la matriz. Estos papeles son reversibles y ahora verifica- 
remos este hecho demostrando que los determinantes de A y A* son 
iguales. (Como los renglones de A son las columnas de A* y viceversa, 
este resultado será suficiente para demostrar que los papeles desempe- 
nados por los renglones y las colmnnas son intercambiables.) 

Teorema 4.10. Para cualquier matriz A de n x n det( A‘) = det(A). 

demostración. Si A no es invertible, entonces rango(/4) < n. Pero 
como rangoí/l') = rango(y4) (Corolario 2 del Teorema 3.5) se tiene que 
A* no es invertible, y entonces, en este caso, det(/4) = 0 = det(/t ( ). 

Si A es invertible, entonces A = E m ... E u donde E u ... , E m son 
matrices elementales. Como det(F') = det(F.) para cada i (véase el 
Ejercicio 5), tenemos que 

det(/4 ( ) = det(E‘ . .. E*J = det(F') . .. det(F^) 

= detíFJ . .. det(F m ) = det(F m ) . .. det(F,) 

= det(F m . .. Fj) = det(/4). ■ 



Corolario. Cualquier argumento sobre determinantes que involucre a los renglo- 
nes de una matriz puede ser enunciado de nuevo en términos de las colum- 
nas de la matriz, }’ cualquier argumento que involucre a las columnas de 
una matriz puede ser enunciado de nuevo en términos de los renglones 
de la matriz■ En particular, si A es una matriz de n x n. 


det(A) = 2 ( — l) i+i Aij • det(A „), 
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donde Áij es la matriz de (n — l)x(n — 1) obtenida a partir de A 
al suprimir el renglón i y la columna j. 


Ejemplo 12. Sea A el siguiente elemento de M 4xi (R): 


/4-1-3 6\ 

-2314 
0 5 0 0 

1 2 3-1/ 


En este caso el cálculo requerido para evaluar det(/t) 
zado al expandir sobre el tercer renglón, y entonces 


I 4 

det(/4) = — 5 detl —2 



/° 

= —5 detl 0 
= — 5 [( — 15) - 2 — 



puede 

ser 

-15 

10' 

7 

2 

3 

-1, 


10-7] = 500. 


Nuestro resultado final nos permite evaluar fácilmente el determinante 
de una matriz triangular. Este resultado hace de la técnica utilizada en 
el Ejemplo 11 un método muy eficiente para evaluar determinantes. 

Teorema 4.11. Si A es una matriz triangular de n x n, entonces det(A) = 
A n A 2 2 . . . A nn ; esto es, el determinante de A es el producto de los ele- 
mentos de A ubicados en la diagonal. 

demostración. Sea A una matriz triangular superior de n x n. La de- 
mostración se hace por inducción sobre n. Si n = 2, entonces A tiene la 
forma 



y entonces det(>4) = A tl A 2 2 — A 12 * 0 = A n A 22 , lo que demuestra el teo- 
rema para matrices triangulares superiores si n = 2. 

Supóngase que el teorema es cierto para matrices triangulares supe- 
riores de (n — 1) x (n — 1) y sea A una matriz triangular superior de 
n x n. Entonces A tiene la forma 

jA 11 A X2 

10 A 22 


A l(n-l) A ín \ 
A 2 (n-Í) A 2n 


AJ 


\0 


0 


0 



Determinantes 


A1 expandir sobre la primera columna, vemos que 



IA 2 2 

Ai(n-l) A 2n \ 

det04) = Ai^dct 


• 


\0 

0 AJ 

~~ A u '(^22 * * * ^nn) 



por la hipótesis de inducción. Esto completa la inducción y demuestra el 
teorema para matrices triangulares superiores. 

Si A es una matriz triangular inferior, entonces A l es una matriz trian- 
gular superior. Por tanto, la primera parte de esta demostración y el 
Teorema 4.10 implican que 

det (A) = det (A*) = M‘)u . .. (A*) nn = A lx . . . A nn . ■ 


Tal como en la Sección 4.1, es posible interpretar geométricamente el 
determinante de un elemento A en M nxn (/Î). Si A u ... , A n son los n 
renglones de A, podemos interpretar 



\aj 


como el volumen n-dimensional (la generalización del área en R 2 y del 
volumen en R 3 ) del paralelepípedo que tiene a los vectores A l9 ... , A n 
como aristas adyacentes. (Para una demostración de este resultado véase 
a Serge Lang, Análisis /, Addison-Wesley, 1968, pp. 413-418.) 

En nuestra anterior exposición del significado geométrico del determi- 
nante formado a partir de los vectores en una base ordenada para R 2 , 
vimos también que este determinante es positivo si y sólo si la base 
induce un sistema coordenado derecho. Una aseveración similar es verí- 
dica en R n . Específicamente, si y es cualquier base ordenada para R n y fi 
es la ordenada estándar para R u , entonces y induce un sistema coordenado 
derecho si y sólo si det(g) > 0, donde Q es la matriz de cambio de 
coordenadas que permite pasar de coordenadas de y a coordenadas de /?. 
Entonces, por ejemplo, 



induce un sistema coordinado izquierdo en R 3 puesto quç 
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mientras que 



induce un sistema coordenado derecho en R 3 porque 

I' - 2 °\ 

detl 2 1 0 = 5 > 0. 

\0 0 1 / 

Más generalmente, si /3 y y son dos bases ordenadas cualesquiera de R n , 
entonces los sistemas coordenados inducidos por f3 y y tienen la misma 
orientación (ambos derechos o ambos izquierdos) si y sólo si det(0) > 0, 
donde Q es la matriz de cambio de coordenadas que permite el paso de 
las coordenadas de y a las de /3. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Si dos renglones de A son idénticos, entonces det(/4) = 0. 

(b) Si B es una matriz obtenida a partir de A mediante el intercambio 

de dos renglones, entonces det(J5) = — det(/í). 

(c) Si B es una matriz obtenida a partir de A multiplicando un renglón 
de A por un escalar c, entonces det(y4) = det (B). 

(d) Si B es una matriz obtenida a partir de A sumando un múltiplo esca- 
lar del renglón i al renglón j(i /), entonces det(y4) = det(B). 

(e) Si E es ima matriz elemental, entonces det(E) = d=l. 

(f) Si A, B ÇM nxn (F), entonces det(>4F) = det(^4) • det(B). 

(g) Una matriz M es invertible si y sólo si det(AÍ) = 0. 

(h) Una matriz MÇ M nxn (F) tiene rango n si y sólo si det(M) -=£ 0. 

(i) E1 determinante de una matriz puede ser evaluado por expansión so- 
bre cualquier renglón o columna. 

(j) det (A*) = —det (A). 

(k) E1 determinante de una matriz diagonal es igual al producto de los 
elementos de la diagonal. 

2. Evaluar cada uno de los siguientes determinantes por el método que se 

indica. 

(a) Por expansión sobre la segunda columna 
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(b) Por expansión sobre ei primer renglón 

-3 1 2 

1 -1 4 

5 6 1 

(c) Por expansión sobre la tercera columna 

1 2 i 1\ 

-110 1 

2 0 0 -1 

0 1 1 1/ 

(d) Por expansión sobre el cuarto renglón 

/1 2 0 - 1 \ 

1-10 2 

10 10 

\0 12 l/ 

3. Evaluar los determinantes de las matrices siguientes por cualquier método 
permitido. En cada caso C es el campo de escalares. 


(a) 


(d) /- 


4-7 3 \ 

(b) 

/ 9 

0 0 

1 2 -1 


4 

8 0 

-3 4 5 / 


\3 

2 7 

-2 + i -1 

5/ \ 


(e) 

3 3 + 2 / 

- 2 / 



4 / 0 

1 +// 





(f) 

2 

0 

-1 

3 \ 

i (8) 

/-1 + 3 / 

' 2 / 

6 

0 \ 


-4 

3 

5 

1 


! 4 

0 

3 + / 

4 / 


1 

6 

0 

2 


o 

1 - 2 / 

0 

2 — / 


i 0 

-5 

3 

V 


i 2 / 

5 

0 

1 +// 


4. Demostrar que ima matriz triangular de n x n es invertible si y sólo si 
en la diagonal no se encuentra ningún cero. 

5. Completar la demostración del Teorema 4.10 demostrando que si E es una 
matriz elemental, entonoes det(E') = detíE). Sugerencia: E' es una ma- 
triz elemental del mismo tipo que E. 

6. Demostrar que si A CM I)X , XF), entonces det(cA) = c n det(A) para cual- 
quier escalar c. 
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7. (a) Una matriz B en M„„„(«) se llama ortogonal si BB* = /. Demos- 

trar que si B es ortogonal, entonces det(fi) = ±1. 

(b) Una matriz _B en M nxn (C) se llama unitaria si BB* = I donde 
(B*) ij = 7i7„ el complejo conjugado de B,j. Demostrar que si B 
es unitaria entonces | det(B) | = 1. Sugerencia: Demostrar primero 

que det(B) = det(B). 

8 . Una matriz B en M nxn (C) se llama antisimétrica si B‘ = —B. Demostrar 
que si B £M nxn (C) es antisimétrica ynes impar, entonces det(B) = 0. 


9.f Sea A £M nxu (F), y sea m tal que 1 < m < n. Sean 



f Àu 

•• ^ lm \ 


Ml(m+1) 

• • A i„) 

B, = 


Àmm' 

B> = 

\^m(m+l) 

• • aJ 


IA( m +i)( m + l) • • • A( m + i 


b 3 = 


\A 


n(m+ 1) 


/ 


y O sea la matriz nula de (n — m ) X m. A se puede escribir simbolica- 
mente como 



Demostrar que det(/l) — det(B,) det(B 3 ). 

10. Sea p = {jci, ... ,jc„} un subconjunto de F“ que contiene n vectores diferen- 
tes, y sea B el elemento de M nxn (F) cuya j-é sima columna es el vector x,. 
Demostrar que j8 es una base para F n si y sólo si det(B) ^ 


11. Complete la demostración del lema del Teorema 4.8. 

12. Recuérdese la transformación lineal T: P n (F) —> F n+1 definida en el Ejerci- 
cio 20 de la Sección 2.4 por T(/) = U(c 0 ), ■ ■ ■ , /(c„^), donde c 0 , ■ ■ • , c„ 
son elementos distintos de un campo infinito F. Sea /3 = (1, x, x 2 , ... , •*"} 
una base ordenada de P n (F) y y la base ordenada normal para F 

(a) Calcular M = [T]}. Una matriz que tiene la forma de M se Ilama ma- 
triz de Vartdermonde. 

(b) Demostrar que det(M)^0 utilizando el Ejercicio 20 de Ia Sec- 
ción 2.4. 
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(c) Demostrar que 


det(M) = n (cj- c t ), 

0 £t<J£n 

el producto de todos los términos de la forma c, — c* para 0 < i < 
7 < rt. 

13. Sea A ÇAA nxn (F) no nula. Para toda m(l < m < n) una submatriz de 
m x m se obtiene de /4 suprimiendo n — m renglones y n — m columnas 
cualesquiera de A. Sea k( 1 < k < n) el mayor entero tal que alguna sub- 
matriz de /: x A: de A tiene un determinante no nulo. I>emostrar que 
rango(^) = k. 

14. Utilizar los resultados de esta sección para demostrar el Ejercicio 8 de la 
Sección 2.4: Si A y B son matrices de m x n tales que AB = / n , entonces 
A es invertible (y por tanto B = A' 1 ). 

15. Demostrar que si A y B son matrices similares, entonces det(/4) = det(B). 


4.4 LA ADJUNTA CLASICA Y LA REGLA DE CRAMER 

En esta sección definiremos la adjunta clásica de una matriz de n x n y 
la utilizaremos para calcular la inversa de una matriz. También obtendre- 
mos la regla de Cramer, la cual permite utilizar determinantes para resolver 
un sistema de ecuaciones lineales cuando éste tenga una matriz de coefi- 
cientes invertible. Nuestra herramienta principal será el siguiente teorema 
que muestra las consecuencias de una expansión de una malriz por ele- 
mentos de una columna y cofactores. 

Teorema 4.12. Sea A una matriz de n x n y sea el çofactor de Aij(l < i, 
j < n). Entonces 

n 

2 Aij • Cìjc — Sjik • det( A), 

\ =i 

donde 8 jic es la deîta de Kronecker. 

oemostración. Si j = k , la ecuación se obtiene a partir del corolario 
del Teorema 4.9. Supóngase que j ^Lk y sea B la matriz que tiene todas 
sus columnas idénticas a las columnas correspondientes de A excepto la 
columna *-ésima, B k , que es idéntica a la columna j de A. Entonces B k = 
B* y ©1 cofactor de B ik es cm. Ahora bien, det(5) — 0 puesto que 

dos columnas de B son idénticas; pero, expandiendo B sobre la columna k, 
tenemos también 


det (B) = Ì B ih c ik = 2 A ijCik . 
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Y por tanto 

n 

2 A, jC ik = 0 si j =£ k. ■ 

i = 1 

Corolario 1 . Si A y Cjj son como en el enunciado del Teorema 4.12, entonces 

n 

2 AijChj = 8 ik • det(A). 

j = l 

demostración. Ejercicio. 

Definición. Sea A urta matriz de n x n. La matriz de n x n adj(A) cuyo ele- 
mento del rengîón i y columna j es el cofactor de A ri se llama la adjunta 
clásica de A. (Entonces adj A — C l , donde Qj es el cofactor de Aìj.) 




Corolario 2. Para toda matriz A de n x n (adj A)A = [det( A)]I. 

demostración . Sea A €M nxn ( F ), y sea c i; - el cofactor de Aij. Entonces 
(adj A)ji = Cij, y por tanto, el elemento de (adj A)A para el /-ésimo 
renglón y A>ésima columna es 

2 (^^j A)jiAik 2 CijAìic Sjjç * det(/4) 

i=l i=l 

por el Corolario 1. Así (adj A)A = [det(/4)]7. ■ 

Ejemplo 14. Sea A tal como en el Ejemplo 13. A1 expandir A sobre 
el segundo renglón, vemos que 


dtt(A) = ( —1)1[2( — 1) -31]+ ( — 1)1(11 -21) =6. 
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1 /-1 5 2\/1 2 3\ /6 0 0\ 

(adj^)v4=| 2-4 210 1 ) = í 0 6 0) 

\ 1 1 —2/\l 1 -1/ \o 0 6/ 

= [det(/4)]/. 

De una manera análoga, si B es como en el Ejemplo 13, entonces al ex- 
pandir B sobre el tercer renglón vemos que 

det(B) = 2[3 • 2 — ( —1)( —4)J -h 1[1(—4) - 3( —1)] = 3. 

Más aún, 

/-4 -3 2\/ 1 3 -1\ /3 0 0\ 

(adj B)B = j 5 3 -1 -1 -4 2 = 0 3 0 

\ 8 6 -1 /\ 2 0 1/ \0 0 3/ 

= [det(B)]/. 

Corolario 3. Si A es una matriz invertible, entonces 

A- 1 = [det(A)Y' (adj A). 

demostración. Si A es invertible, entonces det(/4) ^ 0 (Corolario 1 
del Teorema 4.8). Ahora bien, (adj A)A = \dct(A )]/ por el Corolario 2 y 
por tanto [det(/4)]' x (adj ^4)^4 = I. Y entonces [det(/l)] _1 (adj A) = 

a-\ ■ 


Ejemplo 15. Continuando con el Ejemplo 14, tenemos 


y 


/-! 5 2 \ 

A~ x = [det(/4)] _1 (adj A) = -H 2-4 2 

\ 1 1 - 2 / 

/-4 -3 2\ 

B ' 1 = [det(B)]-’(adj B) = ỳl 5 3 -1 

\ 8 6-1 / 



í 

-i 

1 

-1 

1 

2 



Concluiremos esta sección con una exposición de la regla de Cramer, 
que proporciona un método interesante para resolver ecuaciones matri- 
dales de la forma AX — B, donde A es una matriz invertible. Este método, 
sin embargo, es extremadamente ineficiente, puesto que si A es una ma- 
triz de n x n, la soludón del sistema AX — B por medio de la regla de 
Cramer requiere de la evaluación de n + 1 determinantes de matrices 
de n x n. (Por comparación, el método de solución presentado en la 
Sección 3.4 es un modo más eficiente para resolver tales sistemas. Por lo 
tanto, la regla de Cramer es más bien de interés teorico y estético, que 
práctico.) 



La adjunta clásica y la regla de Cramer 221 


Teorema 4.13. (Regla de Cramer.) Sea AX = B la ecuación matricial de un 
sistema de n ecuaciones lineales con n incógmtas , donde X = (x,, . . . , 
x n ) 1 y B = (bi, . .. , bn) 1 . Si det(A) rf sistema tiene una solución 
única y para toda i(l < i < n) 

Xi = [det(A )] 1 detiMO, 

donde Mi es la matriz de n x n obtenida a partir de A reemplazando la 
i-ésima columrta de A por B. 

demostración. Por cl Corolario 2 del Teorema 4.8, det(/l) impli- 
ca que A es invertible. Por tanto, de acuerdo con el Teorema 3.9, la ecua- 
ción matricial AX~B tiene una solución única. Multiplicando esta 
ecuación por la izquierda por adj A y utilizando el Corolario 2 del Teo- 
rema 4.12 se tiene 

[dei(A)]lX = (adj A)AX = (adj^)B. 

Examinando las coordenadas i-é simas de los vectores columna [det(^4) ] 
X = (adj A)B, puede verse que 


» » 

[det(/4 )]*; = 2 (adj A) tí bj = 2 c abj, 

ì ~ 1 j - l 

donde c }i es el cofactor de A^. Pero 

» 

2 Cjibj 

j = 1 

es la expansión de Mi sobre la /-ésima columna; entonces 


[det(A)]x t = Zcjibj = dtt^Mi), 

)=i 


y consecuentemente 

xt = [det (A)Y 1 * det(Mi) para 1 < i < n. U 

Ejemplo 16. Utilizaremos la regla de Cramer para resolver la ecuación 
matricial AX = B , donde 



Primero, como se vio en el Ejemplo 14, det (A) = 6, por lo que se aplica 
la regla de Cramer. Si M, es la matriz obtenida a partir de A substituyendo 
la i-é siina columna de A por B , se tiene 
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_ det(Af,) 



15 


det(^) 

det(yf) 


“ 6 ~ 2 ’ 


/1 2 

3 \ 


det 1 3 

> 


_ det(A/ 2 ) 

\l 1 - 

1/ 

-6 

det(^) — 

det(/l) 


_ 6 


/1 2 2\ 



det 1 0 3 



_ det(A/ 3 ) 

\l 1 \> 


_3 _ J_. 


det(^) 


det(^í) 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Si una matriz se expande sobre los elementos de una columna y los 
cofactores diferentes de una columna el, resultado es el determinante 
de la matriz. 

(b) Si A €M nxn (F), entonces (adj A)A = 1 . 

(c) Todo sistema de rt ecuaciones lineales con n incógnitas puede ser 
resuelto mediante la regla de Cramer. 

(d) Sea AX = B la forma matricial de un sistema de n ecuaciones lineales 

con n incógnitas, donde X = (x u . .. , x n y. Si det(/4) 0 y si A/ 4 

es la matriz obtenida a partir de A al reemplazar el renglón í' de A 
por B', entonces 


Xi = [det(^)]- 1 det(M,). 

2 . Encontrar la clásica adjunta de las siguientes matrices. 


(a) 

(A t i 

A ì2 \ 


(b) 

/- 

-4 

0 

0 ' 


u, 

aJ 




0 

2 

0 





\ 

0 

0 

5, 



i 0 

°\ 

(d) 

/ 3 

6 

7\ 


(C) 1 

4 

3; 

° 


° 

4 

8 



\ 2 i 

1 + 4/ 

-1 / 


\o 

0 

51 
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(g) 




(e) j 7 1 4\ (f) / 3 

rr 

(h) /4 0 0 
0 4 0 
\0 0 4 

3. Resolver los siguientes sistemas por medio de la regla de Cramer. 

f auATi + «12*2 — f>i 

\ «21*1 + «22*2 = b 2 , (b) 

donde «u « 2 2 — a v .a- 2I =+ 0. 

1 
0 


(a) 


(c) 


(e) 


2*1 + *2 — 3*3 

*! — 2*2 + * 3 = 0 (d) 

3*1 + 4 x 2 — 2*3 = — 5 

*1 — *2 + 4*3 = —2 

— 8*1 + 3 x 2 + *a = 0 (f) 

2*1 — * 2 + *3 = 6 


2*1 + x 2 — 3*3 = 5 
*1 — 2*2 + * 3 = 10 
3*1 + 4jc 2 — 2*3 = 0 

*1 — *2 + 4*3 = —4 

- 8 *! + 3*2 + *3 = 8 

2*1 — *2 + *3 = 0 

3*1 + *2 + *3 = 4 

—2*1 — * 2 =12 
*1 + 2*2 + *3 = —8 


4. Demostrar que para cualquier A £M nxn (F), det(adj A) — [det(/4)] n '. 


5. Sea A una matriz triangular superior invertible de n x n - Demostrar que 
adj A es triangular superior y por tanto A- 1 es triangular superior. Demostrar 
que resultados semejantes son ciertos si A es triangular inferior. 

6 . Demostrar el Corolario 1 del Teorema 4.12. 


7. Demostrar que adj A‘ = (adj A)K 


4.5 RESUMEN —CONCEPTOS IMPORTANTES 
SOBRE DETERMINANTES 

En esta sección resumiremos las propiedades importantes de los determi- 
nantes que nos serán necesarios para el resto del texto. Los resultados 
contenidos en esta sección fueron obtenidos en las Secciones 4.2 y 4.3; 
por tanto los conceptos presentados aquí serán enunciados sin demos- 
tración. 

E1 determinante de una matriz A de n x n con elementos de un cam- 
po F es un elemento de F, expresado como det(/l), que puede ser 
calculado de la siguiente manera: 

1. Si A es de 1 x 1, entonces det(/4) = A 1U el único elemento 
de A. 
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2. Si A es de 2 x 2, entonces det(/4) — Ali/4.22 ^4.12^4.21- Así, por 

ejemplo, 

det(' 3 )= (-1)(3) - (2)(5) = -13. 

3. Si A es de n x n para n > 2, entonces el determinante de A 
puede ser expresado como la suma de los productos de cada ele- 
mento de algún renglón o columna de A multiplicado por ±1 
veces el determinante de una matriz de (n — 1 ) x (n — 1 ) obte- 
nida al eliminar de A el renglón y la columna que contienen el 
elemento en cuestión. La fórmula exacta es 

det (A) = £(-l)^A ir det(Â tj ) 

j -i 

(si el determinante es evaluado a partir de los elementos del ren- 
glón i de A) o bien 

det (A) =2 (-ìynAij detUu) 

1 — 1 

(si el determinante es evaluado a partir de los elementos de la 
columna j de A), donde Â }j es la matriz de (n — 1) x (n — 1) 
obtenida a suprimir el renglón i y la columna / de A. 

En las expresiones anteriores el escalar ( — 1 ) Ui dùt(Âij) se llama el 
cofactor del elemento Aìj. En esta notación el determinante de A se 
evalúa como la suma de productos de cada elemento de algún renglón o 
columna de A multiplicado por el cofactor de ese elemento. Entonces 
det(y4) se expresa en términos de n determinantes de matrices de 
(n - 1 ) X (n — 1). Estos determinantes se evalúan luego en términos 
de determinantes de matrices de (n — 2 ) x (n — 2) y así sucesivamente, 
hasta que se obtienen matrices de 2 x 2. Los determinantes de las matri- 
ces de 2 x 2 se evalúan entonces como en el inciso 2 . 

Consideremos algunos ejemplos de esta técnica al evaluar el determi- 
nante de la matriz de 4 x 4 

/2 1 1 5\ 

, 11-4-1 

A — 

2 0-3 1 

\3 6 1 2/ 

Primero evaluaremos el determinante de A por expansión sobre el cuarto 
renglón. Esto requiere de que conozcamos el cofactor de cada elemento 
del renglón. E1 cofactor de A 41 = 3 es 

í 1 1 5 \ 

(—1 ) 4+1 detl 1 -4 -1 . 

\0 -3 1/ 
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Evaluemos el determinante anterior por expansión sobre la primera colum- 
na. Entonces 

detíl -4 -lì = (-l) 1 +, 0 )det/~* ~J) + (-1) 2+1(1) d et(_* J) 

\0 -3 1/ 

+ (—l) 3 + 1 ( 0 )det(_* _J) 

= l(l)[(-4)(l)-(-l)(-3)] 

+ (-D(l)[(l)(l)-(5)(-3)] + 0 
= -7 -16 + 0= -23. 

Así, el cofactor de A 41 es (— 1 ) 5 ( — 23) = 23. Análogamente, el cofactor 

de +,, = 6es j 5^ 

(—1 ) 4+2 detí 1 -4 -1 


\2 -3 


1 ; 


Evaluando este determinante sobre el segundo renglón da 

/ 2 1 5 \ / 1 5\ 

detl 1 -4 -1 =(-l) 2 + 1 (l)det 


\2 -3 


1 / 


•U D 


+ (— 1 ) 2 + 2 (—4) det 


n 


+ (— 1 ) 2 + 3 (— 1 ) det 


€ -à) 


= (—1)(1)[(1)(1) - (5)(—3)] + ( 1 )(—4)[(2)(1) - (5X2)] 

+ (— 1 )(— 1 )[( 2 )(— 3 ) — ( 1 )( 2 )] 

= -16 + 32 - 8 = 8. 

Y así el cofactor de A 42 es ( —1) 6 (8) = 8 . E1 cofactor de A 43 = 1 es 

/ 2 1 5 \ 

(—1) 4+3 detl 1 1 -11. 

\2 0 1 / 

Si evaluamos este determinante por expansión sobre el tercer renglon, en- 
contramos que 


detl 


/ 2 

1 

5\ n 

5\ 12 

5\ 

1 

1 

-1 =(-l) 3 +, ( 2 )det 

) + (— 1 ) 3 + 2 ( 0 ) detí 


\2 

0 

l/ V 

1 / \ 1 



n 


+ (— 1 ) 3 + 3 ( 1 ) det 

= 1(2)[(1)(—1) - (5)(1)] + 0 + 1(1)[(2)(1) - (1)(1)] 
= -12 + 0 + 1 = — 11 . 
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Por tanto, el cofactor de A 43 es (—1) 7 ( —11) = 11. Finalmente, el cofac- 
tor de A 44 = 2 es 

/2 i n 

(—1) 4+4 detj 1 1 -4 . 

\2 0 -3/ 

Calculando este determinante por expansión sobre la segunda columna, 
obtenemos 


/ 2 

1 

‘\ .. 



: 1 

1 

-4 =(-l)“'(l)det 

4\ /2 

J +(-D 2+2 (l)det 

D 

\2 

0 

-3/ U 

~J/ \2 

— 3/ 


+ (-l) 3+3 (0)det^ 

= (—1)(1)[(1>(—3) - (-4X2)] + 1(1)[(2)(—3) - (1X2)] 

+ 0 

= -5 - 8 + 0 = -13. 


P°r tanto el cofactor de A 44 es ( 1) 8 ( —13) = —13. Ahora podemos eva- 

luar el determinante de A multiplicando cada elemento del cuarto renglón 
por su cofactor; esto da 


det(+) = 3(23) + 6(8) + 1(11) + 2( —13) = 102. 

A fin de comparar calcularemos también el determinante de A por 
expansion sobre la segunda columna. E1 lector deberá verificar que los 
cofactores de A 12 , A 22 y A i2 son 14, 40 y 8, respectivamente. Entonces 


/1 -4 -1\ /2 1 5\ 

det(/l) = (—1) 1+2 (1) detj 2 -3 1 + (—1) 2+2 (1) det 2 -3 1 

\3 12/ \3 1 2/ 


I 2 ' 

+ (—l) 3+2 (0)det| 1 -4 
\3 1 



/2 1 5\ 

+ (—l) 4+2 (6)det 1 -4-1 
\2 -3 1/ 


= 14 + 40 + 0 + 48 = 102. 

P°r supuesto, el hecho de que el valor 102 se haya obtenido de nuevo no 
es ninguna sorpresa puesto que el valor del determinante de + es indepen- 
diente de la elección del renglón o columna utilizada en Ia expansión. 

Obsérvese que el cálculo de det(+) es más fácil cuando se expande 
sobre la segunda columna que cuando se expande sobre el cuarto renglón. 
La diferencia es la presencia de un cero en la segunda columna, lo que 
hizo innecesario evaluar uno de los cofactores (el cofactor de A 32 ). Por 
esta razón es benéfico evaluar el determinante de la matriz expandiendo 
sobre el renglón o columna que tenga el mayor número de elementos nulos. 
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De hecho, es a menudo útil introducir ceros en la matriz por medio de 
operaciones elementales en los renglones antes de calcular el determi- 
nante. Esta técnica utiliza las tres primeras propiedades de los determi- 
nantes. 


Propiedades del determinante 

1. Si B es una matriz obtenida al intercambiar dos renglones o colum- 
nas de A, entonces det(B) = —det(/l). 

2. Si B es una matriz obtenida al multiplicar todo elemento de algún 
renglón o columna de A por algún escalar c, entonces det(B) = c 
X det(/4). 

3. Si B es una matriz obtenida a partir de A al sumar un múltiplo 
del renglón i al renglón j o un múltiplo de la columna i a la 
columna /, donde i =/=j, entonces det(B) = dct(A). 

Ilustraremos el uso de estas tres propiedades en la evaluación de deter- 
minantes calculando el determinante de la matriz A de 4 x 4 considerada 
anteriormente. Nuestro procedimiento será el de introducir ceros en la 
segunda columna de A utilizando la propiedad 3 y luego expandiendo 
sobre esa columna. (Las operaciones elementales sobre los renglones utili- 
zadas consisten en sumar múltiplos del renglón 1 a los renglones 2 y 4 .) 
Este proceso da 


det(/4) = det 



/2 

1 

1 

5 \ 


2 

i 

1 

5 \ 

det 

1 

1 

-4 

-i 

== det 

-1 

0 

-5 

-6 


2 

0 

-3 

i 


2 

0 

-3 

1 


\3 

6 

1 

2/ 


\—9 

0 

-5 

— 28/ 


1 -5 - 

= l(-I) ,+2 det[ 2 -3 

-9 -5 -28/ 

E1 determinante resultante de una matriz de 3 x 3 puede ser evaluado 
de la misma manera. Utilizaremos operaciones elementales del tipo 3 en 
los renglones para introducir dos ceros en la primera columna y luego 
expandir sobre ella. Continuando con lo anterior tenemos 


( '-l -5 -6 


det(/4) = (— 1) - detl 


- (-01 



(—1) , + 1 (— 1) det 


/-!3 

-11 \1 

\ 40 

26/ 


(—13)(26) - (—11 )(40) = 102. 
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E1 lector debiera comparar este cálculo de det(^4) con los anteriores para 
determinar cuánto trabajo de menos se requirió cuando se emplearon las 
propiedades 1, 2 y 3. 

En los siguientes capítulos tendremos a menudo que evaluar el deter- 
minante de matrices de formas especiales. Las siguientes tres propiedades 
de determinantes serán de gran utilidad para ello. 

4. det(7) = 1. 

5. Si dos renglones (o columnas) de una matriz son idénticos, el 
determinante de la matriz es cero. 

6 . E1 determinante de una matriz triangular es igual al producto de 
los elementos de la diagonal. 

Como ilustración de la propiedad 6 , véase que 
/-3 0 0\ 

detj 1 4 0 J = (—3)(4)(— 6 ) = 72. 

\ 2 5 — 6 / 

Las cuatro propiedades restantes del determinante se utilizarán fre- 
cuentemente en capítulos posteriores. De hecho probablemente la propie- 
dad más significativa del determinante es que proporciona una caracteriza- 
ción sencilla de las matrices invertibles (véase propiedad 10 ). 

7. Para cualquier A, det(A) = det (A f ). 

8 . Para cualquier A , B 6 M nxn (F), det (AB) = det(^4) * det (B). 

9. Si Q es una matriz invertible, entonces detíg -1 ) = [det(G)] -1 . 

10. Una matriz Q es invertible si y sólo si det (Q) ■=£ 0. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) E1 determinante de una matriz cuadrada puede ser calculado expan- 
diendo -la matriz sobre cualquier renglón o columna. 

(b) A1 evaluar el determinante de una matriz, es conveniente expandir 
sobre un renglón o columna que contenga el mayor número de ceros. 

(c) Si dos renglones o columnas de A son idénticos, entonces det(^4) — 0. 

(d) Si B es una matriz obtenida al intercambiar dos renglones o colum- 
nas de A, entonces det(F) = det(^4). 

(e) Si B es la matriz obtenida al multiplicar todos los elementos de un 
renglón o columna de A por un escalar; det(B) = det(^4). 

(f) Si B es una matriz obtenida a partir de A sumando un múltiplo de 
algún renglón a un renglón distinto (o un múltiplo de alguna columna 
a alguna columna distinta), entonces det(B) = det(y4). 

(g) E1 determinante de una matriz triangular de n x n es igual al pro- 
ducto de sus elementos de la diagonal. 
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(h) det(/4') = —det(,4). 

(i) Si A, A€M nx „(F), entonces det(/4B) = det(/4) det(B). 

(j) Si Q es una matriz invertible, entonces det((2 _1 ) = [det(fi)]' 1 . 

(k) Una matriz Q es invertible si y sólo si det(ô) 0 . 

2 . Evaluar el determinante de las siguientes matrices de 2 x 2 . 

(a) /4 —5\ (b) /-1 7\ 


,a) (í 1) 

(c) (2 + * -1 + 3/\ 

\1 -2/ 3 - i ) 


(b) , 

(~ l 

7> l 

1 

{ 3 

V 

(d) 

( 3 

4/ 


1 - 6 / 

2 / 


Evaluar el determinante de las siguientes matrices en la manera indicada. 

(a) Expandir sobre la segunda columna 

(.:: -s 

\ 2 3 0/ 

(b) Expandir sobre el tercer renglón 

(c) Expandir sobre la primera columna 

I 0 1 + i 2 \ 

(-2/ 0 1-/ 

\ 3 4/ 0 / 

(d) Expandir sobre el primer renglón 

I i 2+i 0 \ 

3 2i 

\ o -i i — /7 

(e) Expandir sobre la cuarta columna 

0 2 1 3\ 

1 0-2 2 
3-1 0 1 

\-l 1 2 o/ 

Evaluar el determinante de las siguientes matrices por cualquier método per- 
mitido. 

(a) / 2 5 0\ (b) /-1 3 2\ (c) / 1 0 3\ 

-6 13 4 -1 1 2 -1 4 

\ 0 -4 2/ \ 2 2 5/ \—3 2 l/ 
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(d) 

(f) 


/ ' 

2 

_1 \ 

<e) 1 

(- 

-1 

2 + i 

3 

3 

1 + i 

2 


1 

— i 

i 

1 

\—2/ 

1 

4 - 

-iì 

\ 


3/ 

2 

-1 +/ 

1 

0 -2 

3 Ì 

1 

(g) 


2 + i 2 i 

5 + 2A 

-3 

1 

1 

21 



0 

1 - i 1 

3 - 4 i 

0 

4 -1 




0 

0 

3 i 

6 

2 

3 

0 

ll 



\o 

0 

0 

2 / 


5.* Trabajar sobre el Ejercicio 9 de la Sección 4.3. 
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Capítulo 


Diagonalizaoión 


Este capítulo trata el llamado “problema de la diagonalización”. Dada 
una transformación lineal T: V —» V, donde V es un espacio vectorial 
dimensionalmente finito, buscaremos respuestas a las siguientes interro- 
gantes: 

1. ^Existe una base ordenada J3 para V tal que [T]^ sea una matriz 
diagonal? 

2. Si dicha base existe, ^cómo puede encontrarse? 

Como en general los cálculos que involucran a las matrices diagonales son 
sencillos, una respuesta afirmativa a la pregunta 1 nos conducirá a un 
mayor entendimiento de cómo la transformación T opera sobre V, y una 
respuesta a la pregunta 2 nos permitirá obtener soluciones fáciles a mu- 
chos problemas de orden práctico que pueden formularse dentro del 
contexto del álgebra lineal. Consideraremos algunos de estos problemas 
y sus soluciones dentro de este mismo capítulo —véase por ejemplo la 
Sección 5.3. 

Una solución al problema de la diagonalización conduce de una mane- 
ra natural a los conceptos de “eigenvalor” (valor propio o característico) 
y “eigenvector” (vector propio o característico). Aparte del importante 
papel que estos conceptos juegan en el problema de la diagonalización, 
su utilidad quedará también demostrada como valiosas herramientas en el 
estudio de muchas transformaciones no diagonalizables, tal como lo vere- 
mos en el Capítulo 6. 


5.7 EIGENVALORES Y EIGENVECTORES 

Como el problema de la diagonalización implica el estudio de una. trans- 
formación que mapee a un espacio vectorial en sí mismo, es útil dar un 
nombre a tal transformación. En consecuencia, llamaremos a la transfor- 
mación lineai T: V —► V sobre un espacio vectorial V, un operador lineal 
sobre V. 
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Para un operador lineal dado T sobre un espacio vectorial dimensional- 
mente finito V, nos interesarán las matrices que representen a T de acuerdo 
con las diferentes bases ordenadas para V. 

A lo largo de esîe capítulo omitiremos en general la palabra “orde- 
nada” en la expresión “base ordenada”. 

Considérese un operador lineal T en un espacio vectorial dimensional- 
mente finito V y cualquier par de bases fi y /?' para V. Recuérdese del 
corolario al Teorema 2.27 que las matrices [T]^ y [T]p» están relacionadas 
mediante la expresión 

Ub' - Q 'VbQ, 

donde Q es la matriz de cambio de coordenadas que transforma las 
coordenadas de /?' en coordenadas de /?. En la Sección 2.5 definimos 
tales matrices como matrices similares. Un caso especial de utilidad de 
este tipo de relaciones se demuestra en el siguiente teorema. 

Teorema 5.1. Sea AÇM nxil (F) y sea y — {x l9 x 2 , . .. , x n } una base cualquie - 
ra para F\ Entonces [L A ]y = Q _ 1 AQ, donde Q es una matriz de n x n en 
la que la columna j es Xj (j = 1 , 2 , . .. , n). 

demostración. Sea /3 la base estándar para F\ Se puede ver fácilmente 
que la matriz Q es la matriz de cambio de coordenadas que transforma 
las coordenadas de y en coordenadas de /?. Por lo tanto 

[Uy = Q ^bQ = Q 'AQ. U 
Ejemplo 1 . Para ilustrar el Teorema 5.1, sean 

a= (ò ï) eM - (R) i G)}- 

Es muy sencillo verificar que si 

Q = {1 2)' 

entonces 

r-{-\ -0 

y por tanto 

[iA=c-^e=(^ _;)(! 2 2 )(; ;)=(-," n)- 

Como se mencionó anteriormente, las matrices que representan al mis- 
mo operador lineal relativo a bases diferentes son similares. Establecere- 
mos en seguida el recíproco de este resultado. 
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Teorema 5.2. Sea T un operador lineal en un espacio vectorial V n-dimensio- 
nal, y sea /3 una base para V. Si B es cualquier matriz de n x n similar 
a [T]( 3 , entonces existe una base p' para V tal que B = [T]p.. 

demostración. Si B es similar a [T]p, entonces existe una matriz inver- 
tible Q tal que B = Q 'UbQ- Supóngase que 0 = [x 1; x ît ... , x n } y de- 
fínase 

x\ - 2 QijXi para 1 < / < n. 

i -1 

Entonces J3 f = {x[, jc',. . x f n } es una base para V tal que Q es la matriz 
de cambio de coordenadas que transforma las coordenadas de p f en coor- 
denadas de /3. (Ejercicio 11 de la Sección 2.5.) Por lo tanto 

Ub' = Q-VbQ = B 

de acuerdo con el corolario del Teorema 2.27. H 

E1 concepto de similitud es de utilidad en el estudio del problema de 
la diagonalización, pues puede ser utilizado para reformular el problema 
dentro del contexto matricial. Introduciremos ahora el concepto de dia- 
gonalizabilidad. 

Definiciones. Se dice que un operador lineal T sobre un espacio vectorial dimen - 
sionalmente finito V es diagonalizable si existe una base f3 para V tal que 
[T]p sea una matriz diagonal. 

Una matriz cuadrada A es diagonalizable si A es similar a una matriz 
diagonal. 

E1 teorema siguiente relaciona estos dos conceptos y conduce a una 
reformulación del problema de la diagonalización dentro del contexto 
matricial. 

Teorema 5.3. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V. Los siguientes incisos son equivalentes: 

(a) T es diagonalizable. 

(b) Existe una base f3 para V tal que la matriz Ub es diagonalizable. 

(c) La matriz [T] r es diagonalizable para cualquier base y para V. 

demostración. Si T es diagonalizable, entonces existe una base (3 para 
V tal que Ub es una m ^ ïlz diagonal. Entonces [T]p es trivialmente diago- 
nalizable, por lo que (a) implica a (b). 

Sea (3 una base para V tal que [T]p es diagonalizable y sea y una base 
cualquiera para V. Entonces [T]^ y [T] r son similares. Luego, si [T]p es 
similar a una matriz diagonal, también [T] y lo será de acuerdo con la 
transitividad de la relación de similitud. Y entonces [T] r es diagonali- 
zable, demostrando que (b) implica a (c). 
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Finalmente, si [T] y es diagonalizable, existe una matriz diagonal D 
similar a [T] y . Luego, de acuerdo con el Teorema 5.2, existe una base /?' 
para V tal que [T]^ — D. Por tanto, T es diagonalizable y así (c) implica 
a (a). ■ 

Como una consecuencia inmediata de este Teorema tenemos el siguien- 
te resultado de gran utilidad. 


Corolario. Una matriz A es diagonaJizabie si y sólo si L A es diagonalizable. 

Como consecuencia del Teorema 5.3 podemos reformular el problema 
de la diagonalización de la manera siguiente. 

1. ^Es diagonalizable una matriz cuadrada A dada? 

2. Si A es diagonalizable, ^cómo puede determinarse una matriz Q 
invertible tal que Q~ y AQ sea una matriz diagonal? 

Presentaremos ahora el primero de los diferentes resultados que con- 
ducen a una solución del problema de la diagonalización. 


Teorema 5.4. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V. Entonces T es diagonalizable si y sólo si existe una base 
P ~ í Xl > ’ x “} para V y escalares X u . . . , À n (no necesariamente dis - 
tintos) tales que T(xj) = ÀjXj, para 1 < j < n. Bajo estas circunstancias 


M i 

o 


m,= 


0 

^2 


:\ 


\o 0 ••• xj 


demostracion. Supóngase que T es diagonalizable. Entonces existe una 
base /i para V tal que [T] (í -- D es una matriz diagonal. Sean X, ■= Djj y 
P = {*i, . . . , x n }. Entonces para cada /, 


2 D , ,.v ; DjjXj À jXj . 


Recíprocamente, 'supóngase que existe una base p = {x,, ... , Xn ) y 
escalares Ai, . . . , X„ tales que T(x y ) = A jXj. Entonces evidentemente 


/A, 0 

0 A 2 


m. 


0\ 

0 


'0 0 ••• xj I 

Del Teorema 5.4 se derivan las siguientes definiciones. 
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Definiciones. Sea T un operador lineal en un espacio vectorial V. Un elemento 
no rtulo x £ V se llama eigenvector de T si existe un escalar \ tal que 
T(x) — Ax. Al escalar \ se le llama eigenvalor correspondiente al eigen - 
vector x. 

Análogamente, si A es una matriz de n x n en un campo F, un ele- 
mento no nulo x £ F u se denomina eigenvector de la matriz A, si x es un 
eigenvector de L A . Como en el párrafo anterior, el escalar \ se denomina ei- 
genvalor de A correspondiente al eigenvector x. 

A menudo se usan las palabras vector característico y vector propio 
en lugar de eigenvector. Los términos correspondientes para un eigenvalor 
son valor característico y valor propio. 

Con esta terminología vemos que en el Teorema 5.4 la base /? consta 
de eigenvectores de T y que los elementos de la diagonal de [T]^ son los 
eigenvalores de T, por lo que el Teorema 5.4 puede ser enunciado de 
nuevo de la manera siguiente: Un operador lineal T en un espacio vectorial 
dimensionalmente finito V es diagonalizable si y sólo si existe una base [3 
para V compuesta por eigenvectores de T. Además, si T es diagonalizable, 
(3 = {x,, Xo, . . . , x u ) es una base de eigenvectores de T, y D = [T]p; en- 
tonces D es una matriz diagonal y D u es el eigenvalor correspondiente a 
Xj (i ~ 1 ? 2, ... , n). 

Antes de continuar con nuestro análisis del problema de la diagonali- 
zación consideremos dos ejemplos que involucran eigenvectores y eigen- 
valores. 

Ejemplo 2. Sea C * (R) el conjunto de todas las funciones /: R -» R 
que tienen derivadas de todos los órdenes. (Por lo tanto C x (/?) incluye a 
todas las funciones polinomiales, las funciones seno y coseno, las funciones 
exponenciales, etc.) Es fácil ver que C x (/£) es un subespacio del espacio 
vectorial J(R, R) de todas las funciones de R en R como se definieron en 
la Sección 1.2. Defínase T: C x (R) —> C x (R) mediante T(y) = y', donde 
y' es la derivada de y. Puede verificarse fácilmente que T es un operador 
lineal en C x (/?). Procederemos a determinar los eigenvalores y los eigen- 
vectores de T. 

Si \ es un eigenvalor de T, entonces existe un eigenvector y£C x (/?) 
tal que y' = T(y) = \y. Esta es una ecuación diferencial de primer orden 
cuyas soluciones son de la forma y(/) = ce xt para alguna constante c. 
En consecuencia, todo número real \ es un eigenvalor de T y los eigen- 
vectores correspondientes son de la forma ce xt para c ^ 0. (Nótese que 
si \ = 0, los eigenvectores son las funciones constantes no nulas.) 

Ejemplo 3. Sea 

'■‘=(4 2)' "■=(-!)■ y '==(:)• 
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Como 

es un eigenvector de U (y por tanto de A). También Ai = — 2 es el 
eigenvalor asociado con x Y . Àdemás, 



Luego, x 2 es un eigenvector de l A (y de A ) con À 2 — 5 como eigenvalor 
asodado. Nótese que /? — {x u x 2 } es una base para R 2 , y por tanto, por 
el Teorema 5.4 

= (-| “). 

Finalmente, si 

i} 

entonces por el Teorema 5.1, 

Q = 

E1 ejemplo anterior muestra una técnica para diagonalizar una matriz 
A d t n x n: Si/? = (jc 15 x 2 , . .. , x n } es una base para F n que consta de 
los eigenvectores de A, y Q es la matriz de n x n cuya columna / es el 
eigenvector Xj(j = 1, 2, . .. , n), entonces Qr'AQ es una matriz diagonal. 
Para poder emplear este procedimiento necesitamos de un método para 
determinar los eigenvectores de una matriz u operador. Como se verá 
luego, los eigenvectores se determinan fácilmente una vez que se conocen 
los eigenvalores, por lo que principiaremos exponiendo un método para 
calcular los eigenvalores. Como ayuda en este cálculo utilizaremos el teore- 
ma siguiente para introducir el concepto de “determinante” de un operador 
lineal. 

Teorema 5.5. Sea T un operador lineal en un espacio vecîorial dimensional- 
mente finito V y sean p y /?' un par de bases cualesquiera para V. Entonces 
det(Ub) =det([ T] P 0. 

demostración. Sean A = [T]p y B = [Tjp *. Como A y B son similares, 
existe una matriz invertible Q tal que B — Q~ X AQ. Por lo tanto 

det (B) ~ det((A“M<2) = det(g _1 ) *det(/4) * det (Q) 

= [det(e)] 1 ‘ [det (A)] • [det(G)l - det(A). ■ 

Este resultado da lugar a la siguiente definición. 




Eigenvalores y e/genvecfores 237 


Definición. Sea T un operador lineal en un espacio vecíorial dimensionalmente 
finito V. Defimmos el determinante de T, que denotaremos por det(T), de 
la manera siguiente: Escójase una base fi para V, y defínase det(T) = det 
([T]p). Nótese que según el Teorema 5.5 det(T) está bien definido, es 
decir, es independiente de la selección de la base fì. 

Ejemplo 4. Sea T: P 2 (fl) —> P 2 (R), definida mediante T(/) = f, la de- 
rivada de f. Para calcular det(T), sea /? = (1, x, x 2 }. Entonces p es una 
base para P 2 (i?) y 

/° 1 °\ 

m,=(o o 2 

\o 0 0/ 

Por lo tanto det(T) — det([T]p) = 0. 

Nuestro siguiente resultado establece algunas propiedades del deter- 
minante de un operador lineal. Nótese la semejanza de estas propiedades 
con las que demostramos para el determinante de ima matriz en el Capí- 
tulo 4. 

Teorema 5.6. Sea T un operador lineal en un espacio vectorial dimensionalmen - 
te infinito V. Entonces 

(a) T es invertible si y sólo si det( T) 7^ 0. 

(b) Si T es invertible, entonces det( T- 1 ) = [det( T)]” 1 . 

(c) Si U: V —> V es lineal , entonces det( TU) = det( T) det(U). 

(d) Si X es un escalar y /3 es una base cualquiera para V, entonces 

det( T - X\ y ) = det( A - Al), 
donde A — [T]p. 

demostración. Las demostraciones de los incisos (a), (b) y (c) se de- 
jan como ejercicios. Para demostrar el inciso (d), supóngase que A es un 
escalar, fi es una base para V y A = [T] 3 . Entonces [l v ]p = /, y por lo tan- 
to [T — AJ v ]|3 = A — XI. Luego, por definición det(T - Al v ) = det(^ - 
XI). ■ 

E1 teorema siguiente nos proporciona un método para calcular los 
eigenvalores. 

Teorema 5.7. Sea T un operador lineal en un espacio vectorial dimensionalmen - 
te finito V sobre un campo F. Un escalar A Ç F es un eigenvalor de T 
si y sólo si det( T — Al) =0. 

demostración. Supóngase que A es un eigenvalor de T. Entonces existe 
un eigenvector x £V(jc^ 0) tal que l(x) - Xx. Luego 0 = T(jc) - Xx = 
(T — X\)(x). Como x 7^ 0, T — Al no es invertible. Así, según el Teorema 
5.6, det(T - Al) = 0. 
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Recíprocamente, supóngamos que det(T - Al) = 0. Entonces, de nue- 
vo por el Teorema 5.6, T — Al no es invertible. Luego existe un vector no 
nulo x Ç_V tal que j:£N(T — Al). Entonces (T — AI)(jc) = 0, y lógica- 
mente T(*) = \x. Por lo tanto x es un eigenvector (con A como eigenvalor 
asociado) de T. ■ 

Corolario 1 . Sea A una matriz de n x n sobre un campo F. Entonces un esca - 
lar A £ F es un eigenvalor de A si y sólo si det( A — Al) = 0. 

demostración. Ejercicio. 

Ejemplo 5. Sea 

A = (ì 

Como 

det (A - A/) = det ^ 1 4 X j [ x ) = A- - 2A - 3 = (A - 3) (X + 1), 
los únicos eigenvalores de A son 3 y — 1. 

Ejemplo 6. Sea T: P 2 (iî) -* P 2 (/?) el operador lineal definido mediante 
T(/(jc)) = f(x) + xf(x) + f(x), y sea /3 — {1, jc, x 2 }. Entonces f es 
una base para P 2 (f?) y 


n ì o\ 

[T],= 0 2 2 

\0 0 3 


Como 


II — X 1 

det(T - Al) = det([T]^ - XI) = detl 0 2 — X 


0 


0 


0 
2 

3-X/ 


= (1 - X)(2 - X)(3 - X) 

= —(X - l)(X - 2)(X - 3), 


A es un eigenvalor de T si y sólo si A = 1, 2 o 3. 

E1 Ejemplo 6 hace uso de la siguiente consecuencia evidente del Teo- 
rema 5.6. 


Corolario 2. Sea T un operador lineal en un espacio vecíorial dimensionalmen- 
te finito V, y sea U una base para V. Entonces A es un eigenvalor de T 
si y sólo si es un eigenvalor de [T] i? . 

En los Ejemplos 5 y 6 el lector habrá podido observar que si A es 
una matriz de n x n, entonces det(+ — A/„) es un polinomio en A de gra- 
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do n con un coeficiente principal ( — l) n . Los eigenvalores de A son 
sencillamente ceros de este polinomio; de manera que la siguiente defi- 
nición es apropiada. 

Definición. Si AÇM nxn (F), el polinomio det( A — tl n ) en la incógnita t se 
denomina polinomio característico de A.* 

Se puede demostrar fácilmente que matrices semejantes tienen el mis- 
mo polinomio característico (ver Ejercicio 12). Este hecho permite la 
definición siguiente. 

Definición. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V con base /3. Definimos al polinomio característico f(t) de T como 
el polinomio característico de A = [T]^; esto es, 

f(t) = det( A — tl). 

La observación que precede a la definición muestra que ésta es inde- 
pendiente de la selección de la base J3. A menudo representaremos al 
polinomio característico de un operador T mediante det(T — t\). 

E1 siguiente resultado confirma nuestras observaciones sobre los Ejem- 
plos 5 y 6; puede demostrarse mediante un argumento directo de in- 
ducción. 

Teorema 5.8. El polinomio caracterîstico de A£M nxn (F) es un polinomio de 
grado n con coeficiente principal ( — l) u . 

Las siguientes consecuencias del Teorema 5.8 son inmediatas. (Véase 
también el Corolario 2 del Teorema E.2.) 

Corolario 1. Sea A cualquier matriz de n x n y sea f(t) el polinomio caracte- 
ristico de A. Entonces 

(a) Un escalar X es un eigenvalor de A si y sólo si X es un cero del 
polinomio f(t) (es decir, si y sólo si f(A) — 0). 

(b) A tiene como máximo n eigenvalores distintos. 

Corolario 2. Sea T un operador lineal en un espacio vectorial n-dimensional V 
con polinomio característico f(t). Entonces 

(a) Un escalar X es un eigenvalor de T si y sólo si X es un cero del 
polinomio f(t) (es decir, si y sólo si f(X) = 0). 

(b) T tiene como máximo n eigenvalores distintos. 

* E1 lector observador debe haber notado que los elementos de la matriz 
A — îl n no son elementos del campo F. Sin embargo, son elementos de otro campo 
F(t). (El campo F(t) es el campo de los cocientes del anillo de los polinomios 
F[r]. Normalmente esto se estudia en cursos de álgebra abstracta.) En consecuencia 
los resultados sobre determinantes demostrados en el capítulo 4 continúan siendo 
ciertos dentro de este contexto. 
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Los dos corolarios anteriores nos proporcionan un método para deter- 
minar todós los eigenvalores de una matriz o de un operador, y nuestro 
siguiente resultado nos proporciona un procedimiento para determinar los 
eigenvectores correspondientes a un eigenvalor dado. 

Teorema 5.9. Sea T un operador lineal en un espacio vecíorial V, y sea X un 
eigenvalor de T. Un vector x Ç V es un eigenvector de T que corresponde 
a X si y sólo si x 0 y x ÇN(T — XI) 

demostración. Ejercicio. 


Ejemplo 7. Para encontrar todos los eigenvectores de la matriz 

-G 0 

del Ejemplo 5, recuérdese que A tiene dos eigenvalores, A, = 3 y A 2 = — 1. 
Principiaremos encontrando todos ios eigenvectores correspondientes a 
— 3. Sea 

—'=c !)-Co S)-("î -!)• 


Entonces 


■e) 


€R 2 


es un eigenvector correspondiente a Ài = 3 si y sólo si x ^ 0 y si 
•rÇNCLjs), esto es, x=£0 y 

(~2 IVjcA _ (~2x t + x 2 \ _ /0\ 

V 4 -2 )\x 2 ) ^ 4x, - 2xJ 

Evidentemente el conjunto de todas las soluciones de la ecuación ante- 
rior es 

'1' 


Í'G) 


teR 


Por lo tanto x es un eigenvector que corresponde a Xj = 3 si y sólo si 
x = t para alguna í=^0. 

Ahora, supóngase que x es un eigenvector de A que corresponde a 
X 2 = — 1. Sea 

—■«-g o-("ì -?)-e!)» 

*-G) 


entonces 


€N(L B ) 
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si y sólo si x es una solución al sistema 


J 2*! + X 2 = 0 
\4 Xl + 2x 2 = 0. 


Por lo tanto 


N<U)={<(4) : 


í£R 


Luego, x es un eigenvector que corresponde a X 2 = — 1 si y sólo si 




para alguna t ^ 0. 


Obsérvese que 


{( 2 )’ (- 2 )} 

es una base para R 2 que está formada de eigenvectores de A. Luego, por 
el Teorema 5.4, L. t (y por lo tanto A) es diagonalizable. De hecho, si 



el Teorema 5.1 implica que 


Qr'AQ = 



En el Ejemplo 6 vimos que el operador lineal T en P 2 (i?) definido 
mediante T(/(*)) = f(x) + xf'(x) + f(x) tiene como eigenvalores a 1, 
2 y 3. Ahora calcularemos los eigenvectores de T. 


P 2 (R) ----p 2 (tf) 

<t> p <>0 


R 3 


R 3 


figura 5.1 


Recordemos el diagrama de la Fig. 5.1 que procede de la Sección 2.4, 
donde = (1, x, * 2 } y 


A=[T[ P 



Demostraremos que v£P 2 (R) es un eigenvector de T correspondiente 
a X si y sólo si es un eigenvector de A correspondiente a X. (Este 
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argumento es válido para cualquier operador en un espacio vectorial di- 
mensionalmente finito.) Si v es un eigenvector de T que corresponde a 
A., entonces T(v) = Av. Por lo tanto 

L><M V ) = <j>pl(v) = <j>p(\v) = \<j>p(v). 

Ahora bien, <j>p(v) puesto que <j>p es un isomorfismo. Luego <j>p(v) 
es un eigenvector de L, (y por lo tanto de A ) que corresponde a \. Como 
d argumento anterior es reversible, podemos establecer de manera similar 
que si <j>p(v) es un eigenvector de A que corresponde a A, entonces v 
es un eigenvector de T que corresponde a A. 

Una formulación equivalente del resultado demostrado en el párrafo 
anterior es que para cualquier eigenvalor A de A (y por lo tanto de T), 
un vector y £ R f es un eigenvector de A que corresponde a A si y sólo si 
<j>p'(y) es un eigenvector de T correspondiente a A. Este hecho nos permite 
caicular los eigenvectores de T tal como lo hicimos en el Ejemplo 7. 

Sea A, = I y defínase 

/° 1 °\ 

B = A-XJ = \0 I 2 

\0 0 2 / 

Puede demostrarse fácilmente que 




Á 0 , 

|: a e R 

[\ol 



Luego los eigenvectores de A que corresponden a A, son de Ia forma 

I' 

a 0 

\o 

para alguna a 0. En consecuencia, los eigenvectores de T que correspon- 
den a A, = 1 son de la forma 


0 


= a<f>/> 'Oi) = a 


para alguna a 0. Por lo tanto, los polinomios constantes no nulos son 
los eigenvectores de T que corresponden a A,. 

Ahora sea A_. = 2 y defínase 


/-1 1 0 ' 
£ = A-X 2 I = l 0 0 2 
\ 0 0 1 , 
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De nuevo puede verificarse fácilmente que 

N(L,) = <fl|l j: ae R) 

Entonces, los eigenvectores de T que corresponden a A 2 son de la forma 

ir\\ 

(f>fi l \ a\ 1 11 = a<f>-p x (e x + e 2 ) = a(\ + x) = a + ax 

para alguna a += 0. 

Finalmente, considérese A 3 = 3 y 

(-2 1 0 \ 

B = A — A 3 / = | 0 -1 2 I- 

0 0 o/ 


Como 


N(U) = 


/n 



a e R 

V i / 

> 


cualquier eigenvector de T correspondiente a A 3 = 3 es de la forma 

= a<t>p l (e j + le 2 + e 3 ) = a( 1 + 2x + x 2 ) = a + 2 ax + ax 2 
para alguna a^ 0. 

Nótese también que y = (1, 1 + x, 1 + 2x + x 2 ) es una base para 
P o(R) que consta de eigenvectores de T. Luego, T es diagonalizable y 

/' ° °\ 

[T], - 0 2 0 - 

\0 0 3 / 

Terminaremos esta sección analizando los eigenvectores y los eigen- 
valores desde un punto de vista geométrico. Si x es un eigenvector del 
operador lineal T en V, entonces T(jc) = Ajc para algún escalar A. Sea W = 
L([jc] ) el subespacio unidimensional de V generado por x. Si y £ W, 
entonces y — cx para algún escalar c. Entonces 

T (y) = T(cjc) = cT(jc) = c\x — \y £W. 

De manera que T mapea a W en sí mismo. Si V es un espacio vectorial 
sobre el campo de los números reales, entonces W puede considerarse como 
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una recta que pasa por el origen de V (o sea, a través del cero). E1 ope- 
rador T opera en los elementos de W multiplicando a cada elemento por 
el escalar A. Existen diversas posibilidades para la acción de T depen- 
diendo del valor de A (véase Fig. 5.2). 

Càso 1. Si A > 1, entonces T mueve a los elementos de W a puntos más 
lejanos al cero por un factor A. 

Caso 2. Si A = 1, entonces T opera como la transformación identidad 
en W. 

Caso 3. SiO<A<lT mueve a los elementos de W a puntos más 
cercanos a 0 por un factor A. 

Caso 4. Si A = 0 entonces T opera como la transformación cero en W. 

Caso 5. Si A < 0 entonces T invierte la orientación de W; esto es, T 
desplaza los puntos de W de un lado del cero al otro. 

Caso 1 . A > 1 


Caso 2. A = 1 


Caso 3. 0 < A < 1 


Caso 4. a = 0 


Càso 5. A < 0 



La acción de T sobre W~L({*}) cuando x es un eigenvector de T. 

figura 5.2 


Para ilustrar estas ideas, considérense los operadores lineales introdu- 
cidos en los Ejemplos 6, 7 y 5 de la Sección 2.1. Recuérdese que el 
operador T: R 2 —> R 2 definido mediante T(x 1? x 2 ) = (x u ~x 2 ) es una 
reflexión sobre el eje x . Se ve fácilmente que T mapea a ambos ejes en sí 
mismos; luego e ± y e 2 son eigenvectores de T (correspondientes respectiva-* 
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mente a los eigenvalores 1 y — 1). Obsérvese que T opera como la id'entidad 
sobre el eje x e invierte la orientación del eje y. Luego considérese la 
proyección sobre el eje de las x definida mediante U (jc,, x>) — (x u 0). De 
nuevo es geométricamente evidente que U actúa como la identidad en el 
eje x y como la transformación cero en el eje y. Este comportamiento es 
una consecuencia del hecho de que e A y e> son eigenvectores de U corres- 
pondientes respectivamente a los eigenvalores 1 y 0. Finalmente, recuérdese 
que la rotación a través del ángulo 0 es eì operador T 0 : R 2 —» R 2 definido 
mediante T e (x u x 2 ) = (x^ cos 0 — x 2 sen 0, x r sen 0 + x 2 cos 0). Si 0 < 
0 <i r es geométricamente claro que T e no mapea a un espacio unidi- 
mensional de R 2 en sí mismo. Esta observación implica que T 0 no tiene 
eigenvectores (y por tanto tampoco eigenvalores). Para confirmar esta 
conclusión utilizando el Corolario 2 del Teorema 5.8, vemos que el poli- 
nomio característico de T e es 

det(T 0 — rl) = det ( COS ^ 1 s ^ n ^ ^ = F — (2 cos 0)t + 1, 

y sen 0 cos 0 — tj 

el cual no tiene ceros reales puesto que el discriminante 4 cos 2 0 — 4 es 
negativo para 0 < 0 < ?r. Luego, existen operadores (y por tanto matri- 
ces) sin eigenvalores ni eigenvectores. Por supuesto, tales operadores y 
matrices no son diagonalizables. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Todo operador lineal en un espacio vectorial n-dimensional tiene n 
eigenvalores distintos. 

(b) Si una matriz real tiene un eigenvector, entonces tiene un número 
infinito de eigenvectores. 

(c) Existe una matriz cuadrada sin eigenvectores. 

(d) Los eigenvalores deben ser escalares no nulos. 

(e) Cualquier par de eigenvectores son linealmente independientes. 

(f) La suma de dos eigenvalores de un operador lineal T es también un 
eigenvalor de T. 

(g) Los operadores lineales de espacios vectoriales dimensionalmente in- 
finitos nunca tienen eigenvalores. 

(h) Una matriz A d e n x n con elementos de un campo F es similar a 
una matriz diagonal si y sólo si existe una base para F n compuesta 
de eigenvectores de A. 

(i) Matrices similares siempre tienen los mismos eigenvalores. 

(j) Matrices similares siempre tienen los mismos eigenvectores. 

(k) La suma de dos eigenvectores de un operador T es siempre un eigen- 

vector de T. 
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2 . 


Para cada matriz A y base-jS, encontrar [L ,]^. Encontrar también una matriz 
invertible Q tal que fL,i= Q~'AQ. 


(a) A 


(b) A = 





y P = 



3 . Para cada una de las siguientes matrices /4€M n x„(F). 

(i) Determínense todos los eigenvalores de A. 

(ii) Para cada eigenvalor X de A, encontrar el conjunto de eigenvectores 
correspondientes a X. 

(iii) De ser posible, encuéntrese una base para F“ compuesta por eigenvec- 
tores de A. 

(iv) Si se tiene éxito en encontrar la base en (iii), determínese una matriz 
Q tal que Q 'AQ sea una matriz diagonal y calcúlese Q~'AQ. 


para F = R 


(a) 


n 2\ 

,3 2) 



( 0 

(b) 

A = 1 

( -1 



\ 2 

(c) 

A = 

g - 


-2 

1 

2 


D 


— 1 ] para F = R 
5/ 

para F = C 


Sea T: P 2 (R)P 2 (R) definida mediante T((/*)) =/(*) +*/'(*). En- 
contrar todos los eigenvalores de T y encontrar una base J3 para P>(R) tal 
que [T]^ sea una matriz diagonal. 


5 . Demostrar los incisos (a), (b) y (c) del Teorema 5.6. 


6 . Demostrar los Corolarios 1 y 2 del Teorema 5.7. 

7 . Demostrar el Teorema 5.9. 


8 . (a) Demostrar que un operador lineal T en un espacio vectorial dimen- 

sionalmente finito es invertible si y sólo si el cero no es un eigen- 
valor de T. 

(b) Sea T un operador lineal invertible. Demostrar que un escalar X es 
un eigenvalor de T si y sólo si X -1 es un eigenvalor de T+ 

9 . Demostrar que los eigenvalores de una matriz triangular M son los elemen- 
tos de la diagonal de M . 

10 . Sea V un espacio vectorial dimensionalmente finito y X un escalar cual- 
quiera. 
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(a) Para cualquier base J3 para V demostrar que [21 v ]„ = 2/. 

(b) Calcular el polinomio característico de 2l v . 

(c) Demostrar que Al v es diagonalizable y que tiene sólo un eigen- 
valor. 

11 . Una matriz escalar es una matriz cuadrada de la forma kl para algún esca- 
lar A; o sea, una matriz escalar es una matriz diagonal en la cual todos los 
eîementos de la diagonal son iguales. 

(a) Demostrar que si A es similar a una matriz escalar À/, entonces 
A = À/. 

(b) Demostrar que una matriz diagonalizable que sólo tiene un eigen- 
valor es una matriz escalar. 

(c) Concluir que la matriz 

C 0 

no es diagonalizable. 

12. (a) Demostrar qué matrices similares tienen el mismo polinomio carac- 

terístico. 

(b) Demostrar que la definición del polinomio característico de un ope- 
rador lineal en un espacio vectoriai dimensionalmente finito V es 
independiente de la selección de la base para V. 

13. Demostrar las siguientes aseveraciones hechas en la página 241. 

(a) Si vÇP 2 (/?) y </>p(v) es un eigenvector de A correspondiente al eigen- 
valor À entonces v es un eigenvector de T que corresponde al eigenva- 
lor À. 

(b) Si À es un eigenvalor de A (y por tanto de T), entonces un vector 
yÇR 3 es un eigenvector de A correspondiente a À si y sólo si 

es un eigenvector de T correspondiente a À. 

14 . * Para cualquier matriz cuadrada A , demostrar que A y A f tienen el mismo 

polinomio caraeterístico (y por tanto los mismos eigenvalores). 

15 . * (a) Sea T un operador lineal en un espacio vectorial V, y sea x un eigen- 

vector de T correspondiente al eigenvalor À. Para cualquier entero 
positivo m, demostrar que x es un eigenvector de T m correspondiente 
al eigenvalor À w . 

(b) Enunciar y demostrar el resultado para matrices, semejante al del 
inciso (a). 

16. (a) Demostrar qué matrices similares tienen la misma traza. Sugerencia: 

Utilizar el Ejercicio 12 de la Sección 2.3. 
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(b) ^Cómo se definiría la traza de un operador lineai en un espacio 
vectorial dimensionalmente finito? Justificar que la definición que 
se dé es correcta. 

17 . Sea T: AA nxn (F) —> M Jlxll (F) el mapeo definido mediante T(A) = A f , la 
transpuesta de A. 

(a) Verificar que T es un operador lineal en M nxn (F). 

(b) Demostrar que =fcl son los únicos eigenvalores de T. 

(c) Describir las matrices que sean eigenvectores correspondientes a los 
eigenvalores 1 y — 1, respectivamente. 

18 . Demostrar que para cualesquiera A , B£M Ilxn (C) tal que B es invertible, 
existe un escalar c Ç C tal que A + cB no es invertible. Sugerencia: Exa- 
minar a det (A + cB). 

19 . * Sean A y B matrices similares de n x n. Demostrar que existe un, espacio 

vectorial rc-dimensional V, un operador lineal T en V y bases y y para 
V tales que A — [T ]|3 y B — [T] y . Sugerencia: Utilizar el Ejercicio 12 de 
la Sección 2.5. 

20 . Sea A una matriz d t n x n con polinomio característico 

f(t) = (-1 ) n t n + a n - } t n ~' + ... + aj + a Q . 

Demostrar que /(0) = a 0 = det(/l). Deducir que A es invertible si y sólo 
si a 0 0. 

21 . Sean A y /(/) como en el Ejercicio 20. 

(a) Demostrar que f(t) = (A u - t) (A,., — t) . .. (A^ - t) + q(t), don- 
de q(t) es un polinomio en t de grado a lo más (n — 2). 

(b) Demostrar que tr (A) = ( —1 ) w , a„_,. 

22 . * Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 

sobre el campo F. Demostrar que si g(t) £P (F) y x es un eigenvector de 
T correspondiente al eigenvalor X entonces g(T)(jc) = £(à)jc. 

5.2 DIAGONALIZABIUDAD 

En la Sección 5.1 hemos presentado el problema de la diagonalización y 
vemos que no todos los operadores lineales ni todas las matrices son diago- 
nalizables. Aun cuando fuimos capaces de diagonalizar ciertos operadores 
y matrices e incluso obtuvimos una condición necesaria y suficiente para 
diagonalizabilidad (Teorema 5.4), no hemos resuelto el problema de la dia- 
gonalización. Lo que aún se necesita es una prueba sencilla para determinar 
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si un operador o matriz puede ser diagonalizado y, si es posible, tener un 
algoritmo para obtener una base de eigenvectores. En esta sección des- 
arrollaremos dicha prueba y un algoritmo. 

En el Ejemplo 7 de la Sección 5.1 obtuvimos una base de eigenvec- 
tores escogiendo un eigenvector correspondiente a cada eigenvalor. En ge- 
neral, este procedimiento no proporciona una base, pero el teorema 
siguiente muestra que cualquier conjunto construido de esta manera debe 
ser linealmente independiente. 

Teorema 5.10. Sea T un operador lineal enV y sean \ u k 2 , K eigenvalores 
de T diferentes. Si x 1( x 2 , . . . , x k son eigenvectores de T tales que Xj corres- 
ponda n Xj(l < j < k), entonces (x a , x 2 , . . . , x k ) eí linealmente indepen- 

diente . 

demostración. Utilizaremos inducción matemática sobre el número k. 
Supóngase que k— 1. Entonces x a ^0 ya que x a es un eigenvector, y 
entonces {jc, } es linealmente independiente. Supóngase que el teorema se 
cumple siempre para k - 1 eigenvectores, donde k- 1 ^ 1 y que tenemos 
k eigenvectores x u ... , x k correspondientes a distintos eigenvalores 
\ u ... , X fc . Deseamos demostrar que (x a , ... , x k ) es linealmente mde- 
pendiente. Supóngase que se tienen escalares a„ ... , a k tales que 

a a x a + . .. + a k x k — 0. (1) 

Aplicando T a ambos lados de la ecuación (1) obtenemos 

ajfx,) + . . . + a k T(x k ) = a a X a x a + . .. + = 0. (2) 

Ahora multiplicando ambos lados de la ecuáción (1) por X* obtenemos 

a a X*x a + . .. + a k \ k x k = 0. (3) 

Luego, restando la ecuación (3) de la ecuación (2) tenemos 
a a (X a — \ k )x L + . .. + a*- a (X*- a — \ k )x k -i = 0. 

Por la hipótesis de inducción [x u ... , x*- a } es linealmente independiente; 
por lo tanto 

a x (X 3 — \k) = . . • — ak-i(ì^k-i ~~ M) = 0. 

Como Xi, . .. , X* son distintos, se tiene que X a — X* ^ 0 para 1 < í < 
k — 1. Así a k = ... = û*-i = 0, de manera que la ecuación (1) se re- 
duce a a k x k = 0. Como x k =£0, a k = 0; por tanto, a L = . .. = a k = 0 y 
entonces {jc a , ... , x k ) es linealmente independiente. ■ 

Corolario. Sea T un operador lineal en V, un espacio vectorial dimensionalmente 
finito de dimensión n. Si T tiene n eigenvalores distintos, entonces T es 
diagonalizable. 

demostración. Supóngase que T tiene n eigenvalores distintos X a , ... , 
X n y sean x u . .. , x„ eigenvectores de T tales que X, corresponde a Xj 
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P ara 1 < / < Por el Teorema 5.10 . . . , j: n } es linealmente inde- 

pendiente y, como dim(V) =/i, este conjunto constituye una base para V. 
Luego, por el Teorema 5.4, T es diagonalizable. ■ 

Ejemplo 8. Sea 

* = (} J) €M 2x2 (R). 

EI polinomio característico de A (y por tanto de l A ) es 

det (A - tl) = det ' 1 - í) = í(t ~ 2) ’ 

y por lo tanto los eigenvalores de L A son 0 y 2. Como L,, es un operador 
lineal en el espacio vectorial bidimensional R 2 , concluimos del corolario 
anterior que L A (y por tanto A) es diagonalizable. 

Aun cuando el corolario del Teorema 5.10 proporciona una condición 
suficiente para la diagonalizabilidad, esta condición no es necesaria. De 
hecho, el operador identidad es diagonalizable, pero sólo tiene un eigen- 
valor, X = 1. 

Hemos visto que la existencia de eigenvalores es una condición nece- 
saria para la diagonalizabilidad. EI siguiente resultado nos dice más. 


Teorema 5.11. Sea T un operador lineal diagonalizable en un espacio vectorial 
n-dimensional V, y sea f(t) el polinomio característico de T. Enlonces f(t) 
se descompone en un producto de n factores, todos de grado 1; esto es, 
existen escalares A,, A 2 , ... , À H (no necesariamente distintos) tales que 

f(t) = (-l) n (t - x,)(t - X 2 ). . .(t - x„). 

demostración. Supóngase que T es diagonalizable. Entonces existe una 
base para V tal que [T]p = D es una matriz diagonal. Si 


D 


entonces 


/(0 = det(Z) - tl) = det 


/A, 0 • • • 0 \ 

0 A 2 ••• 0 


'0 o ... Xj 


/A, -t 0 • • • 0 \ 

0 X 2 — t • • • 0 


0 0 ••• X n -tì 

= (A, - t)(X 2 — t) ■■■ (X„ — t) = (— l)”(r - A,)(t -X 2 )...(t- X„). I 
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De este teorema es claro que si T es un operador lineal diagonalizable 
en un espacio vectorial rc-dimensional que no tiene n eigenvalores distintos, 
entonces el polinomio característico de T debe tener ceros múltiples. Esta 
observación nos conduce a la definición siguiente. 


Definición. Sea X un eigenvalor de un operador lineal o de una maîriz cuyo 
polinomio caracterísiico es f(t). La multiplicidad (algebraica) de X es el 
mayor entero positivo k para el que (t — A) k es un factor de f(t). 


Ejemplo 9. Sea 


/■ 1 

A = 0 1 

\0 0 



Si /(/) es el polinomio característico de A , entonces f(t) — ~(t— l) 2 
(/ — 2). Por tanto À = 1 es un eigenvalor de A con multiplicidad 2 y 
X — 2 es un eigenvalor de A con multiplicidad 1. 

Si T es un operador lineal diagonalizable en un espacio vectarial V 
de dimensión finita, entonces existe una base para V formada por eigen- 
vectores de T. Sabemos del Teorema 5.4 que [T]p es una matriz diagonal 
en la que los elementos de la diagonal son los eigenvalores de T. Como el 
polinomio característico de T es det([T]^ — tl) se ve fácilmente que cada 
eigenvalor de T debe estar presente como un elemento de la diagonal de 
[T]p exactamente tantas veces como su multiplicidad. Por lo tanto /3 
contiene tantos eigenvectores (linealmente independientes) correspondien- 
tes a un eigenvalor como la multiplicidad del mismo. Así vemos que el 
número de eigenvectores linealmente independientes correspondientes a un 
eigenvalor dado es muy importante para determinar cuándo un operador 
puede ser diagonalizado. Recordando del Teorema 5.9 que los eigenvec- 
tores de T correspondientes al eigenvalor X son los vectores no nulos en 
el espacio nulo de T — Al es necesario el estudio de este conjunto de 
manera natural. 


Definición. Sea T un operador lineal en un espacio vectorial V y sea X un eigen - 
valor de T. Defínase a EaJ~ (xÇ V: T(x) = Ax} = N(T — Àl v ). El con- 
junto Ea se denomina el eigenespacio de T correspondiente al eigenvalor À. 
Como es de esperarse, por eigenespacio de una matriz A entendemos el 
eigenespacio correspondiente del operador L A . 

Es claro que Ex es un subespacio de V que contiene al vector cero y a 
los eigenvectores de T correspondientes al eigenvalor X. E1 número de 
eigenvectores de T linealmente independientes correspondientes al eigenva- 
lor À es, por tanto, la dimensión de Ea. Nuestro resultado siguiente rela- 
ciona esta dimensión con la multiplicidad de X. 
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Teorema 5.1 2. Sea T un operador lineal en un espacio vectorial dimensional - 
mente finito V. Si X es un eigenvalor de T de multiplicidad m, entonces 
1 < dim( Ex) < m. 

demostración. Tómese una base [x u ... , x p } para Ex y extiéndase ésta 
a una base = [x u . . x p , x p+u . . ., x n } para V. Obsérvese que Xi( 1 < i 
< p) es un eigenvector de T que corresponde a X y sea A = [T]p. En- 
tonces 



donde = Xl p y O es la matriz cero. 

Por el Ejercicio 9 de la Sección 4.3, el polinomio característico de 
T es 


m - det(/4 - tl n ) = det ( Bl Q tIp 
- det(B! - tl p ) det (B 3 - tl n . p ). 


B . 


S 2 \ 
- t/n-J 


Sea g(/) = det(B 3 — tl n - v ) el polinomio característico de B 3 . Se ve clara- 
mente que det(B! — tl p ) = (\ — t) f = (-l) p (/ — \) p . Por lo tanto 
/(/) — ( —l) p (/— \) p g(t), de manera que la multiplicidad de \ es al 
menos p. Pero dim(Ex) = p por lo que dim(Ex) < m. ■ 


Ejemplo 10. Sea T: P 2 (/î) -> PJR) el operador lineal definido median- 
te T(/) = /', la derivada de /. La matriz de T con respecto a la base 
= (1, x, x 2 } para P 2 (/?) es 

/° ^ °\ 
m, = o o 2 • 

\o 0 0/ 


Consecuentemente el polinomio característico de T es 

/-' ■ °\ 

det([T]/r ~ tl) - det 0 -t 2 - ~t\ 

\ 0 0 -tj 

Entonces T tiene solamente un eigenvalor (X = 0) con multiplicidad 3. 
Luego Ex — N(T — X\) = N(T). Por lo tanto Ex es el subespacio de P 2 (R) 
que contiene a los polinomios constantes. Y en este caso {1} es una base 
para Ex y dim(Ex) = 1. Consecuentemente no existe una base para P 2 (i?) 
que conste de eigenvectores de T, de modo que T no es diagonalizable. 


Ejemplo 11 . Sea T un operador lineal en R 3 definido mediante 


/ a Á !^ a \ + a Á 

T| a^ I — I 2íz j -f- 3a 2 + 2úf 3 J* 

\a 3 / \ Q\ -f- 4 a$J 



Diagonalizabilidad 253 


Determinaremos el eigenespacio de T correspondiente a cada eigenvalor. 
Si J3 es la base ordinaria para R 3 , entonces 

/4 0 
[T], = |2 3 
\l 0 

Por tanto el polinomio característico de T es 

/4 — t 0 1 \ 

detflT]^ — tl) = detl 2 3-t 2 1 = -(t - 5)(/ - 3) 2 . 

\ 1 0 4 — r/ 



De manera que los eigenvalores de T son A, 5 y A : = 3 con multi- 
plicidades 1 y 2, respectivamente. 

Como 


Ea> — N(T — Ajl) — 





Ea es el espacio de soluciones del sistema de ecuaciones 

— x j -j- x 3 = 0 

< 2 xi — 2 x 2 + 2 x 3 = 0 
x 1 x 3 = 0. 


Se ve fácilmente (utilizando las técnicas del Capítulo 3) que 



es una base para Ea^. De donde dim(EAj = 1. 

De manera análoga Ea 2 — N(T — X 2 \) es el espacio de soluciones del 
sistema 

x x + x 3 = 0 
' 2 x x + 2 x 3 = 0 
k x x + x 3 = 0. 


Y entonces 



0 

1 

0 


es una base para Ea 2 y dim(EA 2 ) = 2. 
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En este caso la multiplicidad de cada eigenvalor À* es igual a la 
dimensión del eigenespacio correspondiente E\.. Obsérvese que 



es una base para R 3 que consta de eigenvectores de T. En consecuencia T 
es diagonalizable. 

Los Ejemplos 10 y 11 sugieren la siguiente conjetura: Si T es un 
operador lineal en un espacio vectorial dimensionalmente finito V tal que 
el polinomio característico de T se puede descomponer en un producto 
de factores de grado l, entonces T es diagonalizable si y sólo si la multi- 
plicidad de cada eigenvalor es igual a la dimensión del eigenespacio de T 
correspondiente a ese eigenvalor. Esta conjetura es, de hecho, cierta, pero 
su demostración implica una complicación que aún no estamos prepa- 
rados para resolver. La dificultad es que aún no sabemos en general que 
la unión de las bases para cada uno de los eigenespacios será una base 
para V. (Este hecho estuvo claro dentro del contexto del Ejemplo 11 
pero el caso general no ha sido demostrado.) Nótese que el Teorema 5.10 
no es útil en este caso a menos que cada eigenespacio sea de dimensión 1. 
Así, debemos apartamos un poco del problema de la diagonalización para 
establecer este hecho, el cual requerirá de la generalización del concepto 
de suma directa (tal como se definió en la Sección 1.3). Para este fin 
será conveniente expresar una suma de subespacios W,, W 2 , . .. , W* (no 
necesariamente directa) como 

k 

2w it 

Ì-Jl 

Definición. Sean W„ W 2 , . .. , W k subespacios de un espacio vectorial V. Escri- 
biremos V = W, ® W 2 0 ■ ■ ■ ® W k v llamaremos a V la suma directa de 
W„ W 2 , . . . , W k si 

v = èw t 

i -1 

y 

Wi n ('S Wj) = (0} para cada i(l < i < k). 

j * i 

Ejemplo 12. Sea V = R 4 y sean W^ = {(a, b , 0, 0): a, b £R}, W 2 = 
{(0, 0, c, 0): c£/?) y W 3 = {(0, 0, 0, d): d£R}. Para cualquier 
elemento (a, b, c, d) de V 

(a, b, c, d) = (a, b, 0, 0) + (0, 0, c, 0) + (0, 0, 0, d) ÇW X + W 2 + W 3 . 
Luego entonces 



Diagonalizabilidad 255 


Para demostrar que V es la suma directa de W h W 2 y W 3 debemos de 
mostrar que W x fì (W 2 + W 3 ) = { 0 }, W 2 D (Wi + W 3 ) = {0} y W 3 H 
H (Wi + W 2 ) = {(?}. Pero estas igualdades son evidentes; de modo que 
V = W x 0 W 2 0 W 3 . 


Nuestro resultado siguiente contiene varias condiciones que son equiva- 
lentes a la definición de suma directa. Nótese que este teorema contiene 
al Teorema 1.6 como un caso especial. 

Teorema 5.13. Sean W l5 W 2 , . .. , W k subespacios de un espacio vectorial di - 
mensionalmente finito V. Las siguientes condiciones son equivalentes: 

(a) V = Wj 0 W 2 0 ... ©W k . 

(b) V = 2j_ Wi y, para vectores x l5 x 2 ,. . ., x k cualesquiera tales 

que Xi ÇWi (i = 1, 2, ... , k), si x t + x 2 + . . . + x k = 0, en- 

tonces Xi — 0 (i = 1 , 2,. . . , k). 

(c) Cada vector v en V puede escribirse de manera única en la forma 

v = Xi + x 2 + ... + x k , donde x L ÇW L (i = 1, 2, . .. , k). 

(d) Si para toda i = 1, 2, . . . , k, y { es una base ordenada cualquiera 

para W i? entonces y t U y 2 U ... U y k * es una base ordenada 
para V. 

(e) Para toda i = 1, 2, . . . , k existe una base ordenada yi para 

Wi(i = 1, 2, . . . , k) tal que y^ U y 2 U ... U y k es una base 

ordenada para V. 

demostración. Si (a) es cierta entonces, por definición, 

V = 2 W;. 

i^i 

Supóngase que x», . .. , x k son vectores tales que x, £Wì(i = 1, 2, ... , 
k) y a:! + x 2 + . . . + x k = 0. Entonces para cualquier i 

—Xi = 2 Xj £ 2 W;. 
j * i j ' i 

Pero también 

-Xì£Wì, y así -x, £Wi n (2 W ; ) = {0}. 

j*i 

Por lo tanto = 0, lo que demuestra a (b). 

Demostraremos en seguida que (b) implica a (c). Puesto que de 
acuerdo con (b) 

V = 2 W; 

i -1 

* Consideraremos a y, U y 2 U . . . u y fc como una base ordenada de la mane- 
ra normal —los vectores de se enumeran primero (en el mismo orden que en y^), 
luego los vectores de y 2 (en el mismo orden que en y 2 ), etc. 



256 Diagonalización 


i 


cualquier vector v £ V puede ser representado en la forma v = x x + x 2 + 
• • • '+ x* para algunos elementos x-, Ç Wj(/ = 1, 2, , k). Debemos 

demostrar que esta representación es única. Supóngase por tanto que 
v = yi + + ... + y k , donde y» € W f (/ =1,2,...,*). Entonces 

(xi ~ ^i) + (x* ~ + . .. + (x k — y k ) = 0. 

Pero como x, — y -, £Wj, se deduce de (b) que x, — y t = 0(i = 1,2, ... , 
k). Luego x, — y-, para cada /, lo que demuestra la unicidad de la repre- 
sentación. 

Para demostrar que (c) implica a (d), sea y; una base para W,(/ = ], 
2, ... , k). Como de acuerdo con (c) 

V = 2 w„ 

i =1 

es evidente que y, U y. 2 U ... U y k genera a V. Supóngase que existen 
vectores x t j £y,(j -- 1 , 2 ,..., nv, e i — 1, 2, . . . , k) y escalares tales 
que 

2 &ì jXi j' 

• . j 

Hágase 

rtìi 

y> flijXiji 

í ■ i 

entonces yi€L(y { ) =W ; y 

>’i + y -2 + ... + y k = 2 QijXij = 0. 

i, i 

Puesto que 0 Ç W 4 para toda / y 0 + 0 + ... + 0 = y, + y 2 + ... + y k , 
la condición (c) implica que v ; = 0 para toda /. Luego, 

VI i 

o = y -ì = 2 (ïjXij 

J- 1 

para toda /. Pero como y, es linealmente independiente, se obtiene que 
fli,- = 0 para / = 1, 2, . .. , m; y toda /. Por lo tanto y» U y 2 U ... U y k 
es linealmente independiente y entonces es una base para V. 

Es inmediato que (d) implica a (e). 

Finalmente, demostraremos que (e) implica a (a). Si y { es una base 
Para W»(/ =1,2,...,*) tal que yi U y 2 U ... U y, es ima base para 
V, entonces 

V = L(y, U y 2 U ... U y/,) 

_ L(yi) + L(y 2 ) + . . . + L(y,) =• 2 W; 
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mediante sucesivas aplicaciones del Ejercicio 12 de la Sección 1.4. Fíjese 
un índice i y supóngase que 

n (2w,). 

j*i 

Entonces 

vÇWi = L(yi) y V6 2 W,- = L(U yj). 

i * i j * i 

Por lo tanto v es una combinación lineal no trivial de y» y 

nera que v puede expresarse como combinación lineal de yi 
U y k en más de una manera. Pero esas representaciones 
Teorema 1.9, por lo que se concluye que 

Wi n (2W,) = {. o }, 

j*i 

demostrando (a). ■ 

La razón para discutir sumas directas es para permitimos demostrar 
que si T es un operador lineal diagonalizable en un espacio vectorial di- 
mensionalmente finito V, entonces la unión de las bases para cada imo 
de los eigenespacios de T es una base para V. E1 teorema anterior muestra 
que esta condición es equivalente a demostrar que, si T es diagonalizable, 
entonces V es la suma directa de sus eigenespacios. Ahora fonnalizaremos 
este importante resultado. 

Teorema 5.14. Sea T un operador lineal en un espacio vectorial n-dimensional 
V. Supóngase que el polinomio característico de T se puede descomponer 
en un producto de factores de grado 1 y sean \ u À 2 , . .. , X k los distintos 
eigenvalores de T. Entonces los siguientes incisos son equivalentes: 

(a) T es diagonalizable. 

(b) V= EA.0EX,© ... © Ex k . 

(c) Si dj — dim{ Eaj) para 1 < j < k, entonces d x + d 2 + ... + 
+ <!& — n. 

(d) Si mj es la multiplicidad de Àj para toda j(l < j < k), entonces 

dim{ E Xj ) = mj(j = 1, 2,. . k). 

demostración. Primero demostraremos que (a) implica a (b). Si T 
es diagonalizable, entonces V tiene una base que consiste en eigenvectores 
de T, de donde se deduce fácilmente que 

V-ÌEx,. 

i = 1 

Sean x t £E \.{i — 1, 2,. .., k) vectores tales que x x + x 2 + ... + x k = 0. 
Ahora bien, cada x t es o bien el vector nulo o un eigenvector de T corres- 
pondiente a Xj. Como por el Teorema 5.10 el conjunto de estos vectores 


U y„ de ma- 
j*ì 1 n 

U y 2 U ... U 
contradicen al 


1 
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no nulos x, es linealmente independiente, x, + x 2 + ... -t- x k = 0 im- 
plica que x^ = x 2 = . . . = x k = 0. Luego, por el Teorema 5.13 V = E\, ® 
© Ea, ® . . . ® E*,. 

Si V = Ex, © Ea, © ... © E\„ entonces se infiere del Ejercicio 5 que 
«'= dim(V) = 2 dim(ExJ = d x + d 2 + ... + <4. 

i = l 

Así (b) implica a (c). 

Demostraremos ahora que (c) implica a (d). Supóngase que 

k 

^di — n. 

i = 1 

Por el Teorema 5.12, dj < m ; para toda / y por tanto 

k k 

n — 2 di < 2 

i=1 i=l 

Pero 

k 

ni j ~ n 

puesto que el polinomio característico se descompone en un producto de 
factores de grado 1. Luego, ya que 

k 

2 (nii — dj) ~ 0 y ntj ~ dj> 0 

i = 1 

para cada i, podemos concluir que d { — nij para cada i. 

Finalmente, demostraremos que (d) implica a (a). Supóngase que 
dj — dim(Ex ; ) — nij para toda / y sea 

i = 1 

Un argumento similar al del primer párrafo de esta demostración muestra 
que W = Ex, © Ea s © . . . © E*,. Si fì, es una base ordenada para E \ { (i = 
= 1,2,...,/:), entonces de acuerdo con el Teorema 5.13 U /3 2 U 
U ... U J3 k es una base para W. Pero U U ... U contiene 

k k 

2 dim(EO = 2 = n 

i = l i-l 

vectores y por lo tanto W == V. De modo que V tiene una base /?! U 
U U ... U J3 k que está formada por eigenvectores de T. Luego T es 
diagonalizable, lo que demuestra (a). ■ 

Este teorema completa nuestro estudio del problema de Ia diagonali- 
zación. Resumiremos algunos de nuestros resultados anteriores en la prue- 
ba y en el algoritmo siguientes. 
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Una prueba para diagonalizabilidad 

Sea T un operador Iineal en un espacio vectorial «-dimensional. Entonces 
T es diagonalizable si y sólo si se satisfacen las siguientes dos condiciones. 

1. E! polinomio característico de T se descompone en un producto 
de factores de grado 1. 

2. La multiplicidad de X es igual a n — rango(T - XI) para cada 
eigenvalor X de T. 

Obsérvese que Ia condición 2 queda automáticamente satisfecha para 
eigenvalores de multiplicidad 1 (Teorema 5.12). Luego, la condición 2 
sólo debe verificarse para eigenvalores de multiplicidad mayor que 1. 


Un algoritmo para la diagonalización 

Sea T un operador Iineal diagonalizable en un espacio vectorial dimensio- 
nalmente finito V y sean X,, . .. , X* los distintos eigenvalores de T. Para 
cada /', sea /3> una base para Ea. = N(T - X;l) y sea J3 = J3 t U Jì 2 U 

U . . . U p k . Entonces J3 es una base para V, y [T]^ es una matriz dia- 
gonal. 

Ejemplo 13. Probaremos si Ia matriz 

/3 . 

A = 0 3 0| e M 3x3 («) 

\0 0 4/ 

es diagonalizable. Como la prueba anterior está enunciada para operadores 
lineales en vez de para matrices, aplicaremos la prueba al operador L, t . 

E1 polinomio característico de L. 3 es det(/í — tl) — — (r — 4) (/ — 3) 2 . 
Por lo tanto L,, tiene como eigenvalores a X 3 = 4 y X 2 = 3 con multipli- 
cidades respectivas 1 y 2. Qaramente se satisface la condición 1 de la 
prueba de diagonalizabilidad y como X, tiene multiplicidad 1, la condi- 


ción 2 se satisface para X^ por lo que 

sólo 

tenemos que verificar la con 

dición 2 de la prueba para X 2 . Como 



/° 

1 

°\ 

o 

ii 

rq 

1 

II 

Ol 

0 

0 

\o 

0 

i/ 


tiene rango 2, 3 — rango(B) = 1. Así, la condición 2 de la prueba falla 
para X s y en consecuencia L A y (por tanto A ) no es diagonalizable. 
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Ejemplo 14. Sea T: R 3 —» R 3 definida mediante 



' - 2 b- 3c\ 
q + 3 b ■{" 3c I* 


Probaremos si T es diagonalizable. Siendo y la base estándar para R 3 , 
tenemos 



E1 polinomio característico de T es — (r — 1 ) 2 (í — 2). Luego T tiene 2 
eigenvalores: A x = 1 con multiplicidad 2 y A 2 = 2 con multiplicidad 1. 
Nótese que la condición 1 de la prueba para diagonalizabilidad queda 
satisfecha. Ahora consideraremos la condición 2. 

Para A^ = 1, 

/-1 -2 -3\ 

3 - rango(T - XJ) = 3 - rango í 1 2 31 = 3-1 = 2. 

\ 0 0 0 / 

Luego la dimensión de Ea, es la misma que la multiplicidad de Ai. Como 
A 2 tiene multiplicidad 1, la dimensión de Ea, es igual a la multiplicidad 
de A 2 . Por tanto T es diagonalizable. 

Encontraremos ahora una base j8 para R 3 tal que [T] e sea una matriz 
diagonal. Dado que 



Ea, es el conjunto de soluciones de 


f—x i — 2 x 2 — 3x 3 = 0 
\ + 2x, + 3 x 3 = 0, 


que tiene como base a 
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Luego Ea, es el conjunto de soluciones de 


2x, - 
' *i i 

que tiene como base a 

h 


Sea fi = fh U /? 2 , entonces J3 es una 


m,=^> 

Nuestro siguiente ejemplo es una 
será de interés en la Sección 5.3. 

Ejemplo 15. Sea 

-G 

Demostraremos que A es diagonalizable y encontraremos una matriz Q 
de 2 x 2 tal que Qr'AQ sea una matriz diagonal. Esta información será 
luego utilizada para calcular A n para cualquier entero positivo n. 

Recuérdese que A es diagonalizable si y sólo si l A es diagonalizable. 
Tenemos que el polinomio característico de l A es (t — l)(t — 2); por 
tanto, l A tiene dos eigenvalores diferentes y entonces l A (y por tanto A) 
es diagonalizable. Para encontrar una base J3 para R 2 tal que [U]p sea una 
matriz diagonal, nótese que L A tiene como eigenvalores a Ai = 1 y X 2 = 2. 
Puede verse fácilmente que 

{(-;» 

es una base para Ea* y que 

{(-!)} 

es una base para Ex a . Entonces para la base 

'■{(-!>(-!)} 


- 2 x 2 — 3x } = 0 
■ x 2 + ' l .x } = 0 
- * 3 = 0 , 



base para V y 



aplicación de la diagonalización que 


-2 

3, 



1 
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tenemos 


Además, si 



entonces, por el Teorema 5.1, 


Finalmente, como 


Qr x AQ - 



Entonces 


Qt'aq = 



A = 


= g (ì 





ï) 


Q 1 


(2 1\/1 0 \/ 1 1 \ / 2 - 2 n 2 — 2 " +1 \ 

\-l -1/V° 2 n )\-ì —2) V-l+2” -l+ 2 M+ 7 ‘ 


Concluiremos esta sección con una aplicación que utilice la diagonali- 
zación para resolver un sistema de ecuaciones diferenciales. 


Ejemplo 16. Considerar el sistema de ecuaciones diferenciales 

x\ = 3Xi + x 2 + x 3 
* x 2 = 2x i + 4x 2 + 2^3 
X 3 = —Xi — x 2 + x 3 , 

donde, para toda /, x t — x t {t) es una función diferenciable real, en la 
variable real t. Es evidente que este sistema tiene solución, que es la solu- 
ción en la que cada x+Z) es la función cero. Determinaremos todas Ias 
soluciones del sistema. 

Sea X: R —> R 3 la función definida mediante 

Ai(0\ 

m = lx 2 (t) • 

\x 3 (t)l 
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La derivada de X se define como la función X\ donde 

/x'M\ 

X'(t)=U(t) I 

Wo/ 

Haciendo 



la matriz de coeficientes del sistema dado, podemos escribir este sistema 
en la forma matricial X' — AX, donde AX es el producto matricial de 
A por X. 

E1 lector deberá verificar que A es diagonalizable y que si 


entonces 


Hágase 


-li i 

/2 0 0\ 
Q~ l AQ=l 0 2 0 
\0 0 4/ 


/2 0 
D = (0 2 

\o 0 


y sustitúyase A = QDQ 1 en X ' = AX para encontrar X’ = QDQ ^X o, 
de manera equivalente, Q X X' = DQ X X. Defínase a Y : R => R 3 mediante 
Y( t) = Q l X(t). Puede demostrarse que Y es una función diferenciable 
y que, de hecho, Y' = Q l X f . Por lo tanto el sistema original puede es- 
cribirse como Y f = DY. 

Como D es una matriz diagonal, el sistema Y f = DY es fácil de resol- 
ver. Puesto que para 

jy,m\ 

Y(t) = I ^2(0 1’ 

Wo/ 

entonces Y f = DY puede escribirse como 

//.(0\ /2 0 0 \/yÁt)\ /2j,(0\ 

/(0 = 0 2 oL 2 (o = 2^(0 • 

\/ 3 (o/ \o 0 4/\j 3 (o/ W 3 (o/ 
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Las tres ecuaciones 


m = 2yAt) 

/2(0 = 2 j 2 (0 
/aíO = 4^3(0 

son independientes entre sí y por tanto pueden resolverse individualmente. 
Se ve fácilmente (como en el Ejemplo 2 de la Sección 5.1) que la solu- 
ción general de estas ecuaciones es y 2 (0 ■= c t e 2t , y 2 (t) = c^é 2 ' y y 3 (t) = 
= c 3 e*‘, donde c u c 2 y c 3 son escalares cualesquiera. Finalmente 

/*.(0\ / 1 0 l\/ Cl e*\ 

* 2 « \ = X(t) = QY(t) = l 0 1 211 c 2 e 2 ' J 

\x 3 (t)l \-l -1 —ì/\c 3 e 4 'l 

( c t e 21 + c 3 e 4 '\ 

c 2 e 2 ' + 2c 3 e 4 ‘ I 

—c,e 2 ' — c 2 e 2 ' — c 3 e 4 '/ 


da la solución general del sistema original. Nótese que esta solución puede 
escribirse como 


X(t) = e 2 ' 


c 


1\ / o\- 

0 ) + ci 1 ì 



Las expresiones en los paréntesis rectangulares son sencillamente elementos 
cualesquiera de Ex, y Ex„ respectivamente, donde X t = 2 y \ 2 = 4. Lue- 
go, la solución general del sistema original es X(t) = e 2t z t + e*‘z u donde 
Zi € Ex, y Z 2 € Ex t . 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Cualquier operador lineal en un espacio vectorial «-dimensional que 
tiene menos de n eigenvalores distintos no es diagonalizable. 

(b) Eigenvectores correspondientes al mismo eigenvalor son siempre li- 
nealmente dependientes. 

(c) Si im espacio vectorial es la suma directa de subespacios W 2 , W 2 , . .. , 
W k , entonces W, n W, = {0} para i += /. 

(d) Si 

V = 2 Wi y W 4 n W,- = { 0 } para i += j. 


entonces V = W, 0 W 2 ® . .. ® W*> 


\ 
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(e) Si \ es un eigenvalor de un operador lineal T, entonces cada elemen- 
to de Ea es un eigenvector de T. 

(f) Si Ài y X 2 son eigenvalores distintos de un operador lineal T, entonces 
Ea, H E Xa - { 0 }. 

(g) Sean A Ç M nxn (F) y /? = {x u . .. , x n } una base para F n formada de 
eigenvectores de A. Si Q es la matriz de n x n cuya columna i es 
Xi(i = 1, 2, . .. , w), entonces Qr'AQ es una matriz diagonal. 

(h) Un operador lineal T en un espacio vectorial dimensionalmente finito 
es diagonalizable si y sólo si la multiplicidad de cada eigenvalor X 
es igual a la dimensión de Ex. 

(i) Todo operador lineal diagonalizable tiene al menos un eigenvalor. 


2 . 


3 . 


4 . 

5 . 


Para cada una de las matrices siguientes A en M nxn (F), probar si A es 
diagonalizable y, en caso de serlo, encontrar una matriz Q tal que Q~ X AQ 
sea una matriz diagonal. 



(c) 

(0 


(ii) 




1 

4 

-1 


Para cada uno de los siguientes operadores lineales T, probar si T es diago- 
nalizable y, en caso de serlo, encontrar una base tal que [T]p sea una 
matriz diagonal. 


(a) T: P 3 (F) P 3 (F) definida mediante T(/) = f + /", donde /' y /" 

son la primera y segunda derivadas de /, respectivamente. 

(b) T: P 2 (F) P 2 (F) definida mediante T (ax 2 + bx + c) = cx 2 + 

+ bx + a. 

(c) T: R 3 —> R 3 definida mediante 



Demostrar la versión matricial del corolario al Teorema 5.10: Si A ÇM nxn (F) 
tiene n eigenvalores distintos, entonces A es diagonalizable. 

Sean W l5 W 2 , . .. , W & subespacios de un espacio vectorial dimensionalmen- 
te finito V tal que 

2 w* = v. 

i-l 


I 
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Demostrar que V es la suma directa de W 1; W 2 , . .. , W* si y sólo si 

k 

dim(V) = 2dim(Wi). 

i = 1 

6. Sea V un espacio vectorial dimensionalmente finito con una base {3 = {x u 
x- 2 , ■ .. , x n ), y sea J3 U /î 2 , . . . , J3 k una partición de J3 (esto es, (3 U /3 2 , . . . , 

son subconjuntos de (3 tales que /3 = /?, U /? 2 U ... u j3 k y /3,- (î /?, = 
= 0 si i = /). Demostrar que V = L(j8,) ® L(j8 2 ) ® . .. ® L(j8 4 ). 

7. Enunciar y demostrar la versión matricial del Teorema 5.11. 

8. (a) Justificar la prueba de diagonalizabilidad y el algoritmo para diago- 

nalización enunciado en esta sección. 

(b) Enunciar el inciso (a) para matrices. 

9. Si 

A = (2 3) €M 2 , 2 (fl), 

encantrar A n para cualquier entero positivo n. 

10. Sea A ÇM nxn (F) tal que tenga dos eigenvalores distintos Ai y X 2 . Si 
dimCE^) = n — 1, demostrar que A es diagonalizable. 

11. Sea T un operador lineal en un espacio vectorial V dimensionalmente finito 
para el cual los distintos eigenvalores de T son \ u \ 2 , ... , \ k . Demostrar 
que 

L({x £ V: x es un eigenvector de T}) = Ex t © Ea 2 © . .. © E \ k . 

12. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
oara el cual los distintos eigenvalores X u X 2) ... , X\ se presentan con multi- 
plicidades m u m> 9 ... , m k , respectivamente. Si /? es una base para V 
tal que [T] 3 es una matriz triangular, demostrar que los elementos de la 
diagonal de [T]^ son X l9 X 2 , . .. , x k y que cada Xj aparece m, veces (j = 1 
2, ...,*). ’ 

13. Supóngase que A es una matriz de n x n cuyo polinomio característico se 
descompone en un producto de factores de grado 1 y que los distintos eigen- 
valores de A son A,, X 2 , ... X k . Para cada /, sea la multiplicidad de Xj. 
Demostrar que 

k 

t r(A ) = 2 mjXj. 

j- i 

14. Sea T un.operador lineal invertible en un espacio vectorial dimensionalmen- 
te finito. Demostrar que T es diagonalizable si y sólo si T _1 es diagonalizable. 
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15. Sea A £M„ xn (F). Demostrar que A es diagonalizable si y sólo si A 1 es 
diagonalizable. 


16. Encontrar la solución general del sistema de ecuaciones diferenciales. 


17. Sea 


r *' = 8 * x + 10*2 

[ *' = — 5*! — 7* 2 . 


A = 


/«11 

a 12 

• a m 

0 2 1 

022 • 

* a 2n 


a nl 

* * a nn> 


la matríz de coeficientes del sistema de ecuaciones diferenciales 


X\ = fln*i + 012*2 + * * * + <2l/.*n 

*' 2 = 0 2 i*i + a 12 x 2 + • • • + a ln x n 


\ x' n = a Bl *j + a„ 2 * 2 + • • • + a nn x n . 

Supóngase que A es diagonalizable y que los distintos eigenvalores de A 
son Ai, A 2 , . . . , A*. Demostrar que una función diferenciable X: R —► R n 
es una solución del sistema si y sólo si X es de la forma 


X(t) — e Xit h + e Xit Z2 + . . . + e Xkt Zk , 


donde z% £Ex. para / = 1, 2, . . . k . Conclúyase que el conjunto de solu- 
ciones del sistema es un espacio vectorial real n-dimensional. 

Los Ejercicios 18-20 se ocuparán del tema de la diagonalización simultánea. 

Definiciones. Dos operadores lineales T y U en el mismo espacio vectorial di - 
mensionalmente finito V se denominan simultáneamente diagonalizables si 
existe una base /3 para V tal que [T]^ y [\J]$ son ambas matrices diagonales. 
De la misma marvera A, B £M n>cn (F) se llaman simultáneamente diagonali- 
zables si existe una matriz invertible Q£M nxn (F) tal que Q~ l AQ y Q _1 BQ 
son ambas matrices diagonales. 

18. (a) Si T y U son operadores lineales simultáneamente diagonalizables en 

un espacio vectorial dimensionalmente finito V, demostrar que [T]p 
y son matrices simultáneamente diagonalizables para cualquier 
base /3. 
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(b) Demostrar que si A y B son matrices simultáneamente diagonalizables, 
entonces i A y l B son operadores simultáneamente diagonalizables. 

19. (a) Demostrar que si T y U son operadores simultáneamente diagonaliza- 

bles, entonces T y U conmutan: es decir, TU — UT. 

(b) Demostrar que si A y B son matrices simultáneamente diagonaliza- 
bles, entonces A y B conmutan. 

Las recíprocas de (a) y (b) se establecerán en el Ejercicio 11 de la 
Sección 5.4. 

20. Sea T un operador lineal diagonalizable en un espacio vectorial dimensional- 
mente finito y sea m cualquier entero positivo. Demostrar que T y T m son 
simultáneamente diagonalizables. 

21. Sean W ly W 2 , Ki, K 2 , . .. , Kp, M 1? M 2 , . . . , N\ q subespacios de im espacio 

vectorial V tales que W x = K, © K 2 © . . . © K p y W 2 = M x © M 2 © ... © 
©M g . Demostrar que si W^ n W 2 = { 0}, entonces W 2 = W x © 

© W 2 = Ki © K 2 © . . . © K p © Mi © M 2 © ... © Mç. 


5.3* í/A1/r£S DE MATRICES Y CADENAS DE MARKOV 

Si A es una matriz cuadrada con elementos complejos, entonces, para cual- 
quier entero positivo m, A m es una matriz cuadrada del mismo tamano 
y ^ue también tiene elementos complejos. En muchas de las ciencias na- 
turales y de la vida existen aplicaciones prácticas de importancia 
que requieren de la determinación del “límite” (si existe alguno) de la 
secuencia de matrices A, A 2 , A 3 , ... En esta sección consideraremos tales 
límites y examinaremos una situación importante en la que surge esta 
clase de límites. 

Definiciones. Sean L, A x , A 2 , A 3 , . . . maîrices de n x p con elementos com - 
plejos. Se dice que la sucesión A u A 2 , A 3 , . . . converge a la matriz L, 
denominada el límite de la sucesión, si para cada i (l<i<n) y 
j( 1 < j < p) la sucesión de números complejos (AJjj, (A 2 )^(A 3 )ij. . . 
converge a L u . (El límite de la sucesión de números complejos (z m : 
m = 1, 2, . . .}, donde z^ = r m + iSm siendo r ln y s m números reales, que- 
da definido en términos de los limites de la sucesión de las partes real e 
imaginaria como 

lim z m = (lim r m ) + i (lim s m ).) 

m ->» w ~»oo m oo 

Para expresar el hecho de que la sucesión A a , A 2 , A 3 , . . . converge a L, 
debemos escribir lim A m = L. 
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Ejemplo 17. Si 


A m = 


entonces 


/1-1 

m 

l(i)" 


H)" 


3 m 2 , (2 m + 1 \\ 
m 2 + 1 ' r \m - 1 ) 

('H)" J 


lim A m = 

m~> w 


/1 0 3 + 2 /\ 
[O 2 e )’ 


donde e es la base de los logaritmos naturales. 

Una sencilla pero muy importante propiedad de los límites de las 
matrices está contenida en el teorema siguiente. Nótese la analogía con la 
propiedad ordinaria de límites de sucesiones de números reales que asegura 
que si lim existe, entonces 

lim ccim = c(lim o^). 


Teorema 5.15. Sea A^, A 2 , A 3 , . . . una sucesión de matrices de n x p con 
elementos complejos tales que 

Hm A Jn L £M nxp (C). 

m ”> oo 

Entonces para cualquier B €M rxn (C) y C€M px8 (C), 
lim BA m = BL y lim A m C = LC. 

m->°o rt| —»oo 

demostración. Para cualquier /(1 <i<r) y ;(1 < / < p), 

lim - lim í* '2B ik (A m ) kj 1 

m >oo J 

= [(A m ) kj \) — 2 B ik L kj = (BL)ij. 

k = 1 m— k~ 1 

Por lo tanto lim BA m = BL . La demostración de que lim A m C — LC es 
♦»-><» »»->'# 
semejante. ■ 

Corolario. Sea A ÇM nxn (C) y sca //m A m '= L. Entonces para cualquier matriz 
invertible QÇM nxn (C), m "°° 

//m (QAQ -1 ) 111 = QLQ~\ 


demostración. Puesto que 

(QAQ ')™ = (QAQ-')(QAQ ->). . . (QAQ ') = G^G 1 , 
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tenemos, de acuerdo con el Teorema 5.15, que 

lim [( QAQ - 1 ) m ] - lim (QA m Qr>) = Q(lim A m )Qr> ~ QLQ 1 . ■ 

m -> 00 

E1 siguiente resultado importante proporciona las condiciones necesa- 
rias y suficientes para la existencia de la clase de límite que estamos consi- 
derando. 

Teorema 5.16. Sea A una matriz cuadrada con elementos complejos. Entonces 
lim A m existe si y sólo si se satisfacen las condiciones siguientes. 

(a) Si X es un eigenvalor de A, entonces \ X \ < 1. 

(b) Si X es un eigenvalor de A tal que | X \ = 1, entonces X es el 
número recd 1. 

(c) Si 1 es un eigenvalor de A, entonces la dimensión del eigenes- 
pacio correspondiente a 1 es igual a la multiplicidad de 1 como 
eigenvalor de A. 

Desafortunadamente no será posible demostrar la suficiencia de estas 
condiciones ni la necesidad de la condición (c) hasta que estudiemos la 
forma canónica de Jordan. Por esta razón la demostración del teorema será 
pospuesta hasta la Sección 6.2 (Ejercicio 18). Sin embargo, la necesidad 
de las dos primeras condiciones se infiere fácilmente del hecho de que 
lim X m si y sólo si X = 1 o bien | X | < 1. (Puede demostrarse que este 

caso, que sin duda el lector conoce para los números reales A, también 
secumple para los complejos.) Supóngase entonces que A es un eigenvalor 
de A para el que las condiciones (a) y (b) fallan, esto es, tal que 
| A | > 1 o bien que | A | = 1 pero A^l. Sea x un eigenvector de A 
que corresponda a A. Considerando a x como una matriz de n x 1 ve- 
mos que, de acuerdo con el Teorema 5.15, 

lim (A m x) =(lim A m )x = Lx, 

m^><*> 

donde L = lim A m . Pero lim ( A m x ) = lim (A w jc) es divergente puesto 

m ~> 00 tn -*» m- 4 °° 

que lim X m no existe. Por lo tanto si lim A m existe, entonces las condi- 

m> °° m > 00 

ciones (a) y (b) del Teorema 5.16 deben satisfacerse. Aun cuando en 
este momento no seamos capaces de demostrar la necesidad de la tercera 
condición, consideremos un ejemplo en el que esta condición falle. Obsér- 
vese que para la matriz 



el eigenvalor A = 1 tiene multiplicidad 2, mientras que dim(Ex) — 1. 
Pero por inducción simple 


B m = 


1 m 
0 1 
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y por lo tanto lim B m no existe. (Veremos más adelante que si A es una 

m * x 

matriz para la que la condición (c) falla, entonces puede escogerse la 
forma canónica de Jordan de A de forma tal que su submatriz izquierda 
superior de 2 x 2 sea justamente esta matriz B.) 

Sin embargo, en la mayor parte de las aplicaciones que involucran este 
tipo de límite, la matriz A es diagonalizable. Cuando la condición (c) del 
Teorema 5.16 se sustituye por la condición de mayor fuerza de que A 
es diagonalizable (ver el Teorema 5.14), entonces se puede demostrar 
fácilmente la existencia del límite. 


Teorema 5.17. Sea AÇM nxn (C) tal que las condiciones siguientes se satis - 
facen: 

(a) Si \ es un eigenvalor de A, entonces | \ | < 1. 

(b) Si \ es un eigenvalor de A tal que \ \ | = 1, entonces \ es el 
número real 1. 

(c) A es diagonalizable. 

Entonces existe îim A m . 


demostración. Como A es diagonalizable, existe una matriz invertible 
Q tal que Qr'AQ — D es una matriz diagonal. Sea 


M i 0 0 \ 

0 X 2 ... 0 


\0 0 ... Xj 


Dado que \ u X 2 , . . . , A„ son los eigenvalores de A , las condiciones (a) 
y (b) muestran que \ h \= 1 o bien | \ t | < 1 para l < i < n. Por lo tanto 


lim A w = 

/ 



si \i = 1 

en cualquier otro caso. 


Pero como 


D m 


Mr o 

I o A? 


l\ 


\o o ••• w 


la sucesión D, D 2 , D\ . . . converge a un Iímite L. Por lo tanto, por el 
corolario del Teorema 5.15, 

lim A m = lim ( QDQ 1 ) m = QLQ \ ■ 


JW-mk 
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La técnica para calcular lim A m , utilizada en la demostración del teore- 

ma anterior, es de gran utilidad. Utilizaremos este método para calcular 
lim A m para la matriz 


A- ì 


Si 


entonces 


D — Q-'(AQ) = 



-ì 





i 

* 




-t 





3 

~ l \ 




-2 

1 

| > 



3 

-1) 




1 

-ì 

"i\ 

z 1 

0 

-3 

1 

i = 

0 

-i 

2 

-i 

-i' 

\o 

0 


0 i/ 


Por lo tanto 


lim A m = lim ( QDQ • 1 ) m = lim (QD m Q~ 1 ) = <2(lim 

m-»® m >oc m- +a0 



3 -i\r /ìoo 

-2 1) lim [ 0 (-£)”■ 0 

3 -i/L \o o ar 

3 —1\/1 0 0\/—1 0 1 
-2 lj 0 0 0 -1 1 2 

3 -l/\0 0 0/\—5 3 7 



Consideremos ahora un ejemplo sencillo en el que se presenta el límite 
de las potencias de una matriz. Supongase que la población de cierta área 
metropolitana se mantiene constante pero que hay un movimiento 
continuo de gente entre la ciudad y los suburbios. Específicamente, sean 
los elementos de la siguiente matriz A las posibilidades de que alguien 
que vive en la ciudad o en los suburbios el primero de enero estará vivien- 
do en cada región el primero de enero del ano siguiente. 


Viven Viven 

actualmente actualmente 
en la en los 

ciudad suburbios 


Vivirán el próximo ano en la ciudad / 0.90 

Vivirán el próximo aiio en los suburbios l 0.10 


0.02 

0.98 


) 


= A 
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Entonces, por ejemplo, la probabilidad de que alguien que vive en la 
ciudad (el primero de enero) estará viviendo en los suburbios el próximo 
ano (el primero de enero) es 0.10. Nótese que como los elementos de 
cada columna de A representan las probabilidades de residencia en cada 
uno de los dos sitios, los elementos de A son no negativos. Más aún, la 
suposición de una población constante en el área metropolitana requiere 
que la suma de los elementos de cada columna de A sea 1. Cualquier ma- 
triz que tenga estas dos propiedades (que los elementos sean no negativos 
y que la suma de los elementos de cada columna sea 1) se llama matriz 
de transición (o matriz estocástica). Para una matriz de transición M de 
n x n arbitraria, los renglones y las columnas corresponden a n estados 
y el elemento Mij representa la probabilidad de pasar del estado / al esta- 
do i en una etapa. En nuestro ejemplo, se tienen dos estados (residir en 
la ciudad y residir en los suburbios), y A 21 representa la probabilidad 
de emigrar de la ciudad a los suburbios en una etapa (ano). 

Determinemos ahora la probabilidad de que un residente de la ciudad 
esté residiendo en los suburbios después de dos anos. Obsérvese primero 
que hay dos maneras diferentes en las que tal cambio puede haberse rea- 
lizado —ya sea permaneciendo en la ciudad un ano y después mudándose 
a los suburbios, o mudándose a los suburbios durante el primer ano y 
permaneciendo en ellos en el segundo (véase Fig. 5.3). La probabilidad 
de que un habitante de la ciudad permanezca en la ciudad el siguiente ano 
es 0.90 y la probabilidad de que un habitante de la ciudad se mude a los 
suburbios durante el próximo aho es de 0.10. Por lo tanto, la probabi- 
lidad de que un residente de la ciudad permanezca en la ciudad durante 
un aho y se mude a los suburbios durante el siguiente es 0.90 (0.10). 
De la misma manera, la probabilidad de que un habitante de la ciudad 
se mude a los suburbios durante el primer ano y permcinezca ahí durante 
el siguiente es 0.10(0.98). De este modo la probabilidad de que un resi- 
dente de la ciudad esté viviendo en los suburbios después de 2 anos es 
0.90(0.10) + 0.10(0.98) = 0.188. Obsérvese que este número se obtuvo 



figura 5.3 
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mediante la misma operación que la que produce (A 2 ) 2 û por lo tanto 
(A 2 ) 2 i representa la probabilidad de que un habitante de la ciudad esté 
residiendo en los suburbios después de dos anos. En general, para cual- 
quier matriz de transición M (Aí w )ì ; representa la probabilidad de pasar 
del estado / al estado i en m etapas. 

Supóngase además que 70% de la población de 1970 del área metro- 
politana vivía en la ciudad y 30% vivía en los suburbios. Registremos esta 
información como un vector columna: 


Proporción de habitantes de la ciudad /0.70\ _ p 

Proporción de residentes de los suburbios \0.30y 

Nótese que los renglones de P corresponden a los estados de residir en la 
ciudad y de residir en los suburbios, respectivamente —el mismo orden 
en que los estados están registrados en la matriz de transición A. Obsér- 
vese también que P es un vector columna que contiene elementos no 
negativos cuya suma es 1; tal vector se denomina vector de probabilidad. 
En esta terminología cada columna de una matriz de transición es un 
vector de probabilidad. 

Consideremos ahora el significado del vector AP. La primera coorde- 
nada de este vector está formada por la operación 0.90(0.70) + 0.02 
(0.30). E1 término 0.90(0.70) representa la proporción de la población 
metropolitana de 1970 que permaneció en la ciudad durante el siguiente 
ano, y el término 0.02(0.30) representa la proporción de la población 
metropolitana de 1970 que se mudó a la ciudad durante el ano siguiente. 
Por lo tanto, la primera coordenada de AP representa la proporción de 
la población metropolitana que vivía en la ciudad 1 ano después de 1970. 
De la misma manera la segunda coordenada de 



representa la proporción de la población metropolitana que vivía en los 
suburbios en 1971. Este argumento puede extenderse fácilmente para de- 
mostrar que las coordenadas de 


A 2 P 


A 



0.57968 

0.42032 


) 


representan las proporciones de Ia población metropolitana que estaban 
viviendo en cada uno de los sitios en 1972. En general, îas coordenadas 
de A m P representan la proporción de la población metropolitana que vivi- 
rá en la ciudad y en los suburbios, respectivamente, después de m etapas 
(m anos después de 1970). 

^Si esta tendencia continúa se vaciará la ciudad? En vista de lo antes 
expuesto es natural definir la proporción eventual de habitantes de la 
ciudad y de los suburbios como la primera y segunda coordenadas, res- 
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pectivamente, de lim A m P. Calculemos este límite. Utilizando la notación 
anterior 


D = Qr'ÂQ=(' 


0.02\ /1 

■) 

V 

luego entonces 

i -il\ 0.10 

0.98/ (5 

; - 1 ! 

L = lim A m = 

m~*oo 

lim (QD m Q~ l ) 

m-*o o 

II 

|Q 

>- 


Por lo tanto 


lim A m P = LP = 




de manera que % de la población vivirá en la ciudad y % de la población 
vivirá en los suburbios. Es fácil demostrar que en este ejemplo 



para cualquier vector de probabilidad P. jPor lo tanto en este ejemplo las 
proporciones eventuales de habitantes de la ciudad y de los suburbios son 
independientes de las proporciones iniciales (dadas por el vector P)! 

Al analizar el problema ciudad-suburbios dimos interpretaciones pro- 
babilistas de A 2 y de AP , demostrando que A 2 es una matriz de transi- 
ción y /ÍP es un vector de probabilidad. Se pueden utilizar argumentos 
semejantes para demostrar que el producto de dos matrices de transición es 
una matriz de transición y que el producto de una matriz de transición 
por un vector de probabilidad es un vector de probabilidad. Una demostra- 
ción altemativa de estos resultados puede basarse en el teorema siguiente, 
que caracteriza a las matrices de transición y a los vectores de proba- 
bilidad. 


Teorema 5.18. Sea M una matriz de n x n con elementos (reales) no negativos, 
sea x un vector columna en R n de coordenadas no negativas y sea u Ç R n 
el vector columna en el que todas las coordenadas son iguales a 1. En- 
tonces: 

(a) M es una matriz de transición si y sólo si M*u = u. 

(b) x es un vector de probabilidad si y sólo si u l x = (1). 

DEMOSTRACIÓN. EjerCÌCÌO. 

Corolario. 

(a) El producto de dos matrices de transición de n x n es una ma - 
triz de transición de n x n. En particuiar, cualquier potencia 
de una matriz de transición es una matriz de transición . 
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(b) El producto de una matriz de transición por un vector de pro- 
babilidad es un vector de probabilidad. 

de mostración . E j ercicio. 

Un proceso estocástico tiene como finalidad predecir el estado de un 
objeto que esté restringido a estar exactamente en uno de ciertos posibles 
estados en un instante dado cualquiera, pero que cambia de estado de 
alguna manera aleatoria. Normalmente, la probabilidad de que el objeto 
se encuentre en un estado particular en un instante dado dependerá de 
factores tales como: 

1. E1 estado en cuestión. 

2. E1 instante en cuestión. 

3. Algunos o todos los estados anteriores en los cuales estuvo el 
objeto. 

4. Los estados en los que se encuentran otros objetos o en los que 
se hayan encontrado. 

Por ejemplo, el objeto podría ser un votante americano y el estado 
del objeto podría ser su preferencia por algún partido político, o el objeto 
podría ser una molécula de HjO y los estados podrían ser los estados 
físicos en los cuales el H 2 0 puede existir (los estados sólido, líquido y 
gaseoso). En estos ejemplos los cuatro factores antes mencionados influen- 
ciarán la probabilidad de que los objetos se encuentren en un estado par- 
ticular en un instante particular. 

Sin embargo, si la probabilidad de que un objeto que está en un estado 
cambie a otro estado diferente depende únicamente de los dos estados 
(y no del tiempo, estados anteriores u otros factores), entonces el proceso 
estocástico se denomina proceso de Markov. Además, si el número de 
estados posibles es finito, entonces el proceso de Markov se llama cadena 
de Markov. E1 ejemplo anterior del movimiento de población entre la 
ciudad y los suburbios es una cadena de Markov de dos estados. 

Consideremos otra cadena de Markov. Un cierto plantel de bachillerato 
desearía obtener información sobre la probabilidad de que se gradúen las 
distintas clases de estudiantes actualmente inscritos. La escuela clasifica a 
un estudiante como de segundo o de primer grado dependiendo del núme- 
ro de créditos que el estudiante haya contabilizado. Los datos con que 
cuenta la escuela indican que de un semestre de otono al siguiente se 
graduará el 40% de los estudiantes de segundo ano, el 30% continuará 
en el mismo grado, y el 30% abandonará los estudios definitivamente. 
Para los de primer ano, los datos muestran que el 10% se graduará para 
el próximo otono, 50% pasará al segundo grado, 20% permanecerá en el 
mismo grado y 20% abandonará definitivamente la carrera. En este aho 
el 50% de los estudiantes de la escuela son de segundo grado y el 50% 
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de primer grado. Suponiendo que la íendencia indicada por los datos se 
prolonga indefinidamente, la escuela desearía saber 

1. E1 porcentaje de los actuales estudiantes que se graduará, el por- 
centaje de los que pasarán a segundo grado, el porcentaje de los 
que estarán en el primer grado y el porcentaje de los que aban- 
donarán definitivamente para el próximo otorio. 

2. Los mismos porcentajes que en el inciso 1 para el semestre de 
otono de aquí a 2 anos. 

3. E1 porcentaje de sus estudiantes actuales que eventualmente se 
graduará. 

E1 párrafo anterior describe a una cadena de Markov de cuatro esta- 
dos que son: 

1. Haberse graduado. 

2. Estar en el segundo grado. 

3. Estar en el primer grado. 

4. Haber abandonado definitivamente. 

Los datos antes mencionados nos proporcionan la matriz de tran- 
sición 

/1 0.4 0.1 0\ 

_ 0 0.3 0.5 0 
~ 0 0 0.2 0 
\0 0.3 0.2 1/ 

de la cadena de Markov. (Nótese que los estudiantes ya graduados o que 
han abandonado de una manera definitiva se considera que permanecen 
de una manera indefinida en sus estados respectivos, por lo que un estu- 
diante del primer grado que abandona la escuela y que regresa semestres 
después, no se considera que haya cambiado de estado, se supone que 
el estudiante permaneció en el estado de ser de primer grado durante el 
tiempo que no se inscribió.) Además, se nos informa que la distribución 
actual de los estudiantes es tal que la mitad de ellos se encuentra respec- 
tivamente en los estados 2 y 3 y ninguno en los estados 1 y 4. E1 vector 


/ °\ 
10.5 



\ 0 / 


que describe la probabilidad inicial de estar en cualquier estado se llama 
vector de probabilidad inicial para la cadena de Markov. 


1 
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Con el objeto de resolver la primera pregunta debemos determinar la 
probabilidad de que un estudiante actual esté en cualquiera de los estados 
para el próximo otono. Como se vio anteriormente, estas probabilidades 
están dadas por las coordenadas del vector 


/0.25\ 


AP = 


0.40 

0.10 


\0.25 / 


Por lo tanto, para el próximo otono, el 25% de los estudiantes actuales 
se graduará, el 40% estará en el segundo grado, el 10% estará en el 
primer grado y el 25% abandonará la escuela. De la misma manera 


A 2 P = A(AP) = 


/°A2\ 

0.17 

0.02 


\0.39/ 


proporciona la información requerida para resolver la pregunta 2: dentro 
de dos anos el 42% de los estudiantes actuales se graduará, el 17% estará 
en el segundo grado, 2% estará en el primer grado y el 39% abandonará 
la escuela. 

Finalmente, la respuesta a la pregunta 3 la proporciona el vector LP y 
donde L = lim A m . E1 lector deberá verificar que si 

m>°° 


/1 -4 19 0\ 

0 7 -40 0 

v 0 0 8 0 

\0 -3 13 1/ 

entonces 



* 

11 

56 

0\ 


0.4 

0.1 

°\ 


-4 

19 

o\ 

0 

h 

4 

0 

0 

0.3 

0.5 

0 

0 

7 

-40 

0 

0 

0 

i 

0 

0 

0 

0.2 

0 

0 

0 

8 

0 


* 

n 

1/ 


0.3 

0.2 

1/ 


-3 

13 

1/ 


0 0 0 \ 

0 0.3 00 

0 0 0.2 0 
0 0 1 / 


D = Q~'AQ = 
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De donde 

L = lim A m = g(lim D m )Q~' 

m-* oo 

/1 -4 19 0W1 0 0 0W1 4 0 

0 7 - 40 0 0 0 0 0 04 4 0 

= 0 0 8000000040 

\0 -3 13 l/\o 0 0 1 /\o 4 41 

De este modo 

LP = 


y por lo tanto la probabilidad de que uno de los actuales estudiantes se 
gradúe es de 5 %i 2 . 

En los dos ejemplos anteriores hemos visto que lim A m P, donde A 

m~* 00 

es la matriz de transición y P es el vector de probabilidad inicial de la 
cadena de Markov, permite conocer las proporciones eventuales en cada 
estado. En general, sin embargo, no es necesario que exista el límite de 
las potencias de una matriz de transición. Por ejemplo, si 



es evidente que lim M m no existe. (Potencias impares de M son iguales 

a Af, y potencias pares de M son iguales a /.) La razón por la cual el límite 
no existe, es que la condición (b) dei Teorema 5.16 no se satisface para 
M ( — 1 es un eigenvalor). De hecho, puede demostrarse (véase Ejercicio 
20 de la Sección 6.2) que las únicas matrices de transición A tales que 
lim A m no existe son precisamente aquellas matrices en las que la condi- 

ción (b) del Teorema 5.16 no se cumple. 

Pero aun cuando exista el límite de las potencias de la matriz de 
transición, el cálculo de dïcho límite puede llegar a ser muy difícil. (Se 
sugiere al lector realizar el Ejercicio 6 para comprobar la verdad de la 
última oración.) Afortunadamente, existe una clase de matrices de tran- 
sición grande e importante para las cuales el límite existe y es fácil de 
calcular —esta es la clase de matrices “regulares” de transición. 

Definición. Si alguna potencia de una matriz de transición contiene únicamente 
elementos positivos, entonces la matriz se llama matriz regular de tran- 
sición. 



\ 4 H o' 

oooo 
_ 0 0 0 0 

/ 4 n h 



1 


280 Diagonalización 

Ejemplo 18. La matriz de transición 

/0.90 0.02 \ 

V 0.10 0.98/ 

de la cadena de Markoy que describe el movimiento de población entre 
la ciudad y los suburbios es claramente regular puesto que todos los ele- 
mentos son positivos. Por otra parte, la matriz de transición 

/1 0.4 0.1 0\ 

_ 0 0.3 0.5 0 

“ 0 0 0.2 0 

\0 0.3 0.2 1/ 

de la cadena de Markov que describe las inscripciones del plantel de bachi- 
llerato no es regular. (Es fácil demostrar que la primera columna de A m 
es 

/ 1 \ 

0 

0 

\ot 

para toda m; de donde (A m ) 41 , por ejemplo, no es nunca positiva.) 

Obsérvese que una matriz regular de transición puede contener elemen- 


tos nulos; por ejemplo, 



/0.9 

0.5 

°\ 

M = \ 0 

0.5 

0.4 

\o.i 

0 

0.6/ 


es regular puesto que todos los elementos de M- son positivos. 

En el resto de esta sección nos dedicaremos principalmente a demos- 
trar que si A es una matriz regular de transición, entonces existe L — lim A m 

m -♦* 

y las columnas de L son idénticas. (Recuérdese la forma de L en el 
problema ciudad-suburbio.) Con este hecho será fácil calcular el límite. 
Durante el transcurso de la demostración de este resultado obtendremos 
algunos teoremas interesantes sobre la magnitud de los eigenvalores de 
cualquier matriz cuadrada. Estas cotas estarán dadas en términos de la 
suma de los valores absolutos de los elementos de los renglones y de las 
columnas de la matriz. La terminología necesaria se introduce en la defini- 
ción siguiente. 

Definiciones. Sea A £AA nxll (C). Dejínase a p\(A) como la suma de los valores 
absoluios de los elemenios del renglón i de A y vj(A) como la suma de 
los valores absolutos de los elementos de la columna j de A. Entonces 

pi (A) m 2| A u 

j : 1 


para i — 1, 2, . . . , n 
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y 


vj(A) = 2 | Aìj | para j = 1, 2, . . . , n. 

j =i 


La suma de renglones de A, denotada por p(A), y suma de columnas 
de A denotada por v(A), se definen como 


p(A) = max (pi( A ): 1 < i < n} y v(A) — max {vj(A): 1 < j < n }- 


Ejemplo 19. Para la matriz 

/ - -■ s \ 

A = I —4 0 6 l> 

\ 3 2 - 1 / 

P i(A) = 7, P2 (A) = 10 , P ,(A) = 6, v x (A) = 8 , v 2 (-4) = 3 y v 3 (ì4) = 
= 12 . Por lo tanto p(/4) = 10 y v(A) = 12 . 

Nuestros siguientes resultados muestran que el menor de entre p(A) 
y v(/4) es una cota superior para el valor absoluto de los eigenvalores 
de A. En el ejemplo anterior, por ejemplo, A no tiene ningún eigenvalor 
cuyo valor absoluto sea mayor de 10. 


Teorema 5.1 9. Sea X un eigenvalor de A£M nxn (C). Entonces \ X| < p(A). 


DEMOSTRACIÓN. Sea 


X — 


n 

\xj 


un eigenvector de A para el que X es el eigenvalor correspondiente. Enton- 
ces x satisface la ecuación matricial Ax — Xx que puede ser escrita como 
el sistema de ecuaciones lineales 

2 A ijXj - \Xi (4) 

Supóngase que x- K es la coordenada de x que tiene el mayor valor absoluto 
y sea b — | Xk |. De la /;-ésima ecuación de (4) tenemos 

n n 

I X | b = | X 11 x k I = I \Xu f = I 2 A kj Xj I < 2 | A ki x i I 

(5) 

= 2 I A >;i || Xj | < 2 | A ki I b = Pk( A ) b < p( A ) b - 

Pero como x que es un eigenvector no nulo, b 0. Luego, dividiendo 
ambos lados de la ecuación (5) por b, se obtiene | X | < p(^4). ■ 
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Corolario 1 . Sea X un eigenvalor de AÇM nxn (C). Enîonces | X | < min {p(A), 
v(A)}. 

demostración. Como por el Teorema 5.19 |à| < p(A), es suficiente 
demostrar que | À | < v(A). 

E1 Ejercicio 14 de la Sección 5.1 muestra que À es un eigenvalor de 
A f . Por lo tanto, de acuerdo con el Teorema 5.19 I À | < p(A f ). Pero los 
renglones de A f son las columnas de A. Por lo tanto p(A *) = v(A), y 
así | À | < v(A). ■ 

Como la suma de los elementos de las columnas de una matriz de tran- 
sición es 1, se obtiene de inmediato la siguiente conclusión a partir del 
Corolario 1. 


Corolario 2. Si X es un eigenvalor de una matriz de transición, entonces 

M<i- . 

E1 siguiente resultado muestra que se ha alcanzado la cota superior 
en el corolario anterior. 


Teorema 5.20. Toda matriz de transición tiene a 1 como eigenvalor. 

demostración. Sea A una matriz de transición de n x n y sea u£ R n 
el vector columna en donde cada coordenada es 1. Entonces, según el 
Teorema 5.18, A*u — u y por tanto u es un eigenvector de A f que corres- 
ponde al eigenvalor 1. Pero como A y A f tienen los mismos eigenvalores 
se tiene que 1 también es un eigenvalor de A. ■ 

Supóngase ahora que A es una matriz de transición para la que algún 
eigenvector que corresponde al eigenvalor 1 tiene únicamente coordenadas 
no negativas. Entonces algún múltiplo de este vector será un vector de 
probabilidad P, así como un eigenvector de A que corresponde al eigen- 
valor 1. Es interesante observar que si P es el vector de probabilidad 
inicial de una cadena de Markov que tenga a A como matriz de transi- 
ción, entonces la cadena de Markov es complétamente estática, pues en 
esta situación A m P = P para cualquier entero positivo m y por lo tanto 
la probabilidad de estar eri cada estado nunca cambia. Considérese, por 
ejemplo, el problema ciudad-suburbios con 



Teorema 5.21 . Sea A £M nxn (C) una matriz en la que todos los elementos son 
positivos y sea X un eigenvalor de A tal que j À | = p(A). Entonces 
X = p(A), y {u} es una base para Ea, donde 
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demostración. Como | A | = p(A) las tres desigualdades de la ecua- 
ción (5) en la demostración del Teorema 5.19 son realmente igualdades, 
esto es 


(a) 


n n 

2 AjtjXj 21 | AkjXj j, 

) =1 


(b) 


2 I || x ì | “ 2 | 


/=> i 


;=>l 


b , 


(c) P *04) - pM), 


donde x, b y k son los mismos que se definieron en la demostración del 
Teorema 5.19. 

Veremos en el Ejercicio 15 (b) de la Sección 7.1 que (a) se satisface 
si y sólo si todos los términos A k jXj(j = 1 , 2, ... , n) son múltiplos no 
negativos de algún número complejo no nulo z . Sin pérdida de generalidad, 
supondremos que | z | = 1. Luego existen números reales no negativos 
Ci, ... , c n tales que 


A k jXj CjZ. 


( 6 ) 


Evidentemente (b) se satisface si y sólo si para cada / tenemos que 
A k j — 0 o | Xj | = b. Como se supone que cada elemento de A es positìvo, 
concluimos que (b) se satisface si y sólo si 

| Xj | = b para j = 1, 2, . .. , n. (7) 

Así tenemos que la ecuación (5), y por tanto el inciso (c) anterior, es 
válida para k ” 1, 2, . .. , n. 

De la ecuación (6) vemos que 


Xj - z (/ 1> 2,. . ., w), 

Ahj 

y por lo tanto, de la ecuación (7), 


b = \ xj 




(/ = 1, 2,. . n). 


Por tanto Xj = fez para / = 1, 2, . . . , n. Así 



(Xi\ 


(bz\ 


(\\ 

X — 

■ 

= 

• 

— bz 

■ 


. 

UJ 


\bzj 


li/ 


y entonces { u } es una base para Ex. 
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Claramente se ve que u es un eigenvector de A correspondiente al 
eigenvalor p(A) puesto que, de acuerdo con el inciso (c) anterior, 






iPÁA)\ 


/P(A)\ 


1 \ 

: | 

= 

• 

= 


= 

: ! 
. j 

= P(A ) 

• 

u 


i % u 


\pM)Ì 


\P(A)I 


1 / 


= p(A)u 


Pero el párrafo anterior muestra que si A es cualquier valor de A tal que 
| A | = p(A), entonces u es un eigenvector al que corresponde A. Por lo 
tanto A = p(A). ■ 


Corolario 7. Sea AÇM nxn (C) una matriz en la cual cada elemento es positivo, 
y sea A un eigenvalor de A tal que | A | = v(A). Entonces A = v(A), y 
la dimensión de E\ es 1. 

demostración. Ejercicio. 


Corolario 2. Sea A £M nxn (C) una malriz de transición en la que cada elemento 
es positivo y sea A un eigenvalor de A distinto de 1. Entonces | A | < 1. 
Además, la dimensión del eigenespacio correspondiente al eigenvalor 1 
es 1. 

demostración. Ejercicio. 

Nuestro siguiente resultado generaliza el corolario anterior para matri- 
ces regulares de transición y, por tanto, demuestra que las matrices regu- 
lares de transición satisfacen las dos primeras condiciones de los Teore- 
mas 5.16 y 5.17. 


Teorema 5.22. Sea A una matriz regular de transición. 

(a) Si A es un eigenvalor de A, entonces | A | < 1. 

(b) Si A es un eigenvaîor de A tal que | A | = 1, entonces A es el nú - 
mero real 1 y dim(E\) = 1. 

En otras palabras, A = 1 es el único eigenvalor de A cuyo valor absoluto 
es 1 y dim( Ea) — 1. Todos los demás eigenvalores de A tienen valores 
absolutos menores que 1. 

demostración. E1 inciso (a) ya fue demostrado como Corolario 2 del 
Teorema 5.19. 

Como A es regular, existe un entero positivo 5* tal que A* tiene única- 
mente elementos positivos. Como A es una matriz de transición y los 
elementos de/E son positivos, los elementos de A* + ' ~ A S (A) son positivos. 
Sea A un eigenvalor de A cuyo valor absoluto es 1. Entonces A* y A" +1 
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son eigenvalores de A* y A s+ \ respectivamente, y tienen un valor absoluto 
de 1, y de acuerdo con el Corolario 2 del Teorema 5.21, X 8 = X s+1 = 1. 
Luego X — 1. Sean E x y E' los eigejiespacios de A y de ^4% respectiva- 
mente, correspondientes al eigenvalor X = 1. Entonces E x Ç E' x , pero E' 
tiene dimensión 1 (Corolario 2 del Teorema 5.21). Por lo tanto E x = E' x 
y dim(Ex) = 1. ■ 

Corofar/o. Sea A una matriz regular de transición diagonalizabte. Entonces exis- 
te lim A m . 

E1 corolario anterior, que se obtiene directamente de los Teoremas 
5.22 y 5.17, no es el mejor resultado posible. De hecho, puede demostrarse 
que si A es una matriz regular de transición, entonces la multiplicidad 
de 1 como eigenvalor de A es 1. Entonces, de acuerdo con el Teorema 
5.12, se satisface la tercera condición del Teorema 5.16. Así, si A es 
una matriz regular de transición, existe lim A m , sea A diagonalizable o 

m -» 50 

no. Sin embargo, como ocurrió con el Teorema 5.16, el hecho de que 
la multiplicidad de 1 como eigenvalor de A sea 1 no puede demostrarse 
ahora. Sin embargo, enunciaremos este resultado aquí (dejando la demos- 
tración para el Ejercicio 20 de la Sección 6.2) y deduciremos más hechos 
sobre el lim A m cuando A es una matriz regular de transición. 

Teorema 5.23. Sea A una matriz regular de transición de n x n. Enlonces 

(a) La multiplicidad de 1 como eigenvalor de A es 1. 

(b) El lim A m existe. 

m -»=o 

(c) L — lim A lìl es una matriz de transición. 

in->» 

(d) AL — LA = L. 

(e) Las columnas de L son idénticas. De hecho, cada columna de 
L es igual al único vector de probabilidad v que es también un 
eigenvector que corresponde al eigenvalor 1 de A. 

(f) Para cuaîquier vector de probabilidad x, lim{ A m x) = v. 

DEMOSTRACIÓN. 

(a) Véase el Ejercicio 20 de la Sección 6.2. 

(b) La demostración de que lim A m existe se obtiene del inciso (a) 

m ** 

y de los Teoremas 5.22 y 5.16. 

(c) Como A m es una matriz de transición de acuerdo con el coro- 
lario del Teorema 5.18, cada elemento de A m es no negativo (m = 1, 2, 
3, . . .). Por tanto 

Lij — lim (A m )ij > 0 para 1 < /, / < n. 
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Además, 


2 Ui = 


2 [lim ( A m )n] = lim [" 2 (/4 m ) i y - | = lim (1) = 

i = Li = l J m-> x 


Luego L es una matriz de transición. 

(d) De acuerdo con el Teorema 5.15, 


para !</<«. 


AL — A (lim A m ) = lim (AA m ) = lim A m+1 = L. 

m->» «<Uí m->°° 

De manera análoga LA = L. 

(e) Como AL = L , de acuerdo con el inciso (d), cada una de las 
columnas de L es un eigenvector de A correspondiente al eigenvalor 1. 
Además, de acuerdo con el inciso (c), cada columna de L es un vector de 
probabilidad. Entonces de acuerdo con el inciso (a) cada columna de L 
es igual al único vector de probabilidad v correspondiente al eigenvalor 
1 de A. 

(f) Sea x cualquier vector de probabilidad y hágase a y = Lx. Enton- 
ces y es un vector de probabilidad (corolario del Teorema 5.18), y 
según el inciso (d) Ay = ALx = Lx = y. Por lo tanto y es también un 
eigenvector que corresponde al eigenvalor 1 de A. Entonces, de acuerdo 
con el inciso (e), y := v. ■ 


Definición. El vector v del inciso (e) del teorema anterior se denomina vector 
de probabilidad fija (o vector estacionario) de la matriz regular de tran - 
sición A. 

Utilizaremos ahora el Teorema 5.23 para obtener información sobre 
los porcentajes eventuales en cada estado de una cadena de Markov que 
tiene una matriz regular de transición. 

Ejemplo 20. En una investigación realizada en la antigua Persia se obtu- 
vo oomo resultado que en un día en particular el 50% de los persas prefería 
una hogaza de pan, el 30% prefería una jarra de vino y ei 20% restante 
prefería un momento de holgorio. Una investigación subsecuente realizada 
un mes después arrojó los datos siguientes: De los que prefirieron una 
hogaza de pan en la primera investigación, el 40% siguieron prefiriendo 
una hogaza de pan, el 10% ahora prefirieron una jarra de vino y el 50% 
prefirieron irse de parranda; de los que prefirieron una jarra de vino en 
la primera investigación, el 20% prefirió ahora una hogaza de pan, el 
70% continuaron prefiriendo una jarra de vino y el 10% ahora prefirie- 
ron la parranda; de los que prefirieron el holgorio en la primera investi- 
gación, el 20% prefirió ahora una hogaza de pan, el 20% prefirió ahora 
una jarra de vino y el 60% continuó prefiriendo lo mismo. 

La situación descrita en el párrafo anterior es una cadena de Markov 
de tres estados en donde los estados son las tres posibles preferencias. Supo- 
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niendo que la tendencia anterior continúe, podemos predecir el porcentaje 
de persas en cada uno de los estados para cada mes a partir de la 
investigación original. Haciendo que los estados uno, dos y tres sean 
respectivamente las preferencias por el pan, el vino y el holgorio, vemos 
que el vector de probabilidad que da la probabilidad inicial de estar en 
cada uno de ios estados es 


y la matriz de transición será 



/0.50\ 


p = 1 

0.301 



\o.20/ 


/0.40 

0.20 

0.20\ 

0.10 

0.70 

0.20 

\o.50 

0.10 

0.60/ 


Las probabilidades de estar en cada uno de los estados m meses después 
de la encuesta original son las coordenadas del vector A m P. E1 lector po- 
drá verificar que 


AP = 



r 6 \ 

A 2 P = A(AP) = 0.32 , 
\0.42/ 


A 3 P = A(A 2 P) = 



/0.2504X 

A*P= A(A 3 P) =0.3418 
\o.4078/ 

Nótese la convergencia progresiva de A”'P. 

Como A es regular, la predicción a largo plazo relativa a las prefe- 
rencias de los persas puede obtenerse calculando el vector de probabi- 
lidad fija para A. Este vector es el vector de probabilidad único v tal que 
(A - /)v = 0. Si 



vemos que la ecuación matricial (A - /)v = 0 arroja el siguiente sistema 
de ecuaciones lineales: 


—0.60t>, + 0.10v 2 + 0.20«, = 0 

0.10«! - 0.30« 2 + 0.20«j = 0 

0.50«, + 0.10« 2 — 0.40« 3 = 0. 
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Se puede demostrar fácilmente que 



es una base para el espacio de soluciones de este sistema. Por lo tanto el 
único vector de probabilidad fija para A es 


5 

5 + 7 + 8 

7 

5 + 7 + 8 

8 

0 + 7 + 8/ 



Entonces a largo plazo, el 25% de los persas preferirá una hogaza de 
pan, el 35% preferirá una jarra de vino y el 40% preferirá un rato de 
holgorio. 

Nótese que si 


entonces 



i' ° °\ 

Q-'AQ= 0 0.5 0 • 

\0 0 0 . 2 / 

Y así 

n o ov 

Q 1 =Q o 0 o \q~ 1 
\o 0 0 / 

/0.25 0.25 0.25 
= 10.35 0.35 0.35 
\0.40 0.40 0.40, 





0 

0\ m " 

lim A m = Q 

lim 

o 1 

0 

0.5 

0 



\0 

0 

0/ _ 


Ejernplo 21. Los granjeros de Lamron siembran un cultivo por aiio —ya 
sea maíz, soya o trigo. Como ellos creen en la necesidad de hacer una 
rotación de cultivos, estos agricultores no siembran el mismo cultivo en 
anos subsecuentes. De hecho, de la superficie total de cultivo en la cual 
se siembra un determinado cultivo, exactamente la mitad será sembrada 
con los otros dos cultivos durante el ano siguiente. Este ano, 300 hectáreas 
fueron sembradas de maíz, 200 hectáreas fueron sembradas de soya y 100 
hectáreas de trigo. 
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La situación descrita en el párrafo anterior es otra cadena de Markov 
de tres estados en la que los tres estados corresponden respectivamente a 
las áreas sembradas de maíz, soya y trigo. Sin embargo, en este problema 
se dio la cantidad de tierra destinada a cada cultivo en vez de los porcen- 
tajes de la superficie total de cultivo (600 hectáreas). Transformando estas 
cantidades en fracciones de la superficie total, vemos que la matriz de 
transición A y el vector de probabilidad inicial de la cadena de Markov 
son 

300 \ 

600 

200 
600 
100 
600/ 

Entonces la fracción de la superficie total de cultivo destinada a cada 
uno de los cultivos en m anos estará dada por las coordenadas de A m P 
y las proporciones eventuales de la superficie total de cultivo destinadas 
para cada cultivo son las coordenadas de lim A m P . Así, las cantidades 

eventuales de tierra destinada a cada cultivo se obtienen al multiplicar este 
límite por la superficie total de cultivo; esto es, las cantidades de tierra 
para ser utilizadas eventualmente en cada cultivo son las coordenadas de 
600(lim A m P). 

Como A es una matriz regular de transición, el Teorema 5.23 demues- 
tra que lim A m es una matriz L en la cual cada columna es igual al 

único vector de probabilidad fija para A . Puede verse fácilmente que el 
vector de probabilidad fija para A es 




Entonces 




Luego, a largo plazo esperamos que 200 hectáreas sean sembradas cada 
ano con cada cultivo. (Para un cálculo directo de 600 (lim A rn P), véase 
el Ejercicio 14.) 
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En esta sección nos hemos concentrado fimdamentalmente en la teoría 
de las matrices regulares de transición. Existe otra clase interesante de 
matrices de transición que puede representarse en la forma 



donde I es una matriz identidad y O es una matriz nula. (Tales matrices 
de transición no son regulares puesto que el bloque inferior izquierdo con- 
tinúa siendo O para cualquier potencia de la matriz.) Los estados corres- 
pondientes a la submatriz identidad se denominan estados absorbentes 
porque uno de tales estados no puede ser abandonado una vez que se ha 
entrado en él. Una cadena de Markov se llama cadena de Marhov absor - 
bente si es posible pasar de un estado cualquiera a un estado absorbente 
en un número finito de etapas. 

Obsérvese que la cadena de Markov que describió las características 
de los registros en un plantel de bachillerato es una cadena de Markov 
absorbente con los estados 1 y 4 como sus estados absorbentes. Los lec- 
tores interesados en conocer más sobre las cadenas de Markov absorbentes 
deben consultar Introduction to Finite Mathematics (tercera edición), 
por J. Kemeny, J. Snell y G. Thompson, Prentice-Hall, Inc., 1974 o bien 
Discrete Mathematical Models por Fred S. Roberts, Prentice-Hall, Inc., 
1976. 


Una aplicación 

En especies que se reproducen sexualmente, las características de ima pro- 
genie con respecto a una característica genética en particular están deter- 
minadas por un par de genes, uno heredado de cada padre. Los genes 
para una característica determinada son de dos tipos, G y g. E1 gen G 
representa la característica dominante y g representa la característica 
recesiva. La descendencia con genotipos GG o Gg muestran las caracte- 
rísticas dominantes mientras que la progenie con características gg tienen 
características recesivas. Por ejemplo, en los humanos, los ojos cafés son 
una característica dominante y los ojos azules son la característica recesiva 
correspondiente; por ello, cualquier descendencia con genotipos GG o 
Gg tendrán los ojos cafés mientras aquellos cuyo tipo sea gg tendrán los 
ojos azules. 

Consideremos la probabilidad de tener descendencia de cada genotipo 
para un progenitor macho de genotip>o Gg. (Supondremos que la población 
bajo consideración es grande, que el cruzamiento es aleatorio con res- 
pecto al genotipo y que la distribución de cada genotipo dentro de la 
población es independiente del sexo y de la esperanza de vida.) 
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Sea 


P = 



la proporción de la población adulta con genotipos GG, Gg y gg, respec- 
tivamente, al principio del experimento. Este experimento describe una 
cadena de Markov de tres estados con una matriz de transición. 

Genotipo del Progenitor 
GG Gg gg 

Genotipo GG / k i °\ 

del Gg i i i =A 

E>escendiente g g \ q ^ 


Se puede verificar fácilmente que B 2 contiene sólo elementos positivos; 
luego, B es regular. Entonces, al permitir que sólo los machos del genotipo 
Gg se reproduzcan, la proporción de la descendencia en la población que 
tiene un cierto genotipo se estabilizará en el vector de probabilidad fija 
para B, que es 



Ahora supóngase que se deben realizar experimentos semejantes con 
machos de genotipos GG y gg. Estos experimentos son cadenas de Markov 
de tres estados con matrices de transición 

/1 } 0\ /0 0 0\ 

^= 0 i 1 y C= 1 i ol 
\o 0 0/ \0 i 1/ 

respectivamente. Con el objeto de considerar el caso donde todos los 
genotipos machos pueden reproducirse, debemos formar la matriz de tran- 
sición M = pA + qB 4- rC, que es una combinación lineal de A, B y C 
ponderada por la proporción de machos de cada genotipo. Entonces 

íp + b y + i? ° \ 

M = I \q + r \p + + \r p + \qY 

\ 0 \q + \r \q + r) 

Para simplificar la notación, sea a = p + \q y b = iq + r. (Los números 
a y b representan respectivamente las proporciones de los genes G y 
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g en la población.) Entonces 

/a \a 0\ 
M = \b ± a\> 

\0 \b bì 


donde a + ô = p + <y + r=l. 

Sean p', q' y r' la proporción de la descendencia de primera genera- 
ción que tiene respectivamente genotipos GG, Gg y gg. Entonces 


/P'\ I a P +j<*q \ / û 2 \ 

í J = MP = j bp + \q + ar 1 = J 2ab !• 

\r'ì \ jbq + br j \ b 2 ) 

Con objeto de considerar los efectos de cruzamientos no controlados 
entre la progenie de primera generación, se debe determinar una nueva 
matriz de transición M basada en la distribución de los genotipos de pri- 
mera generación. Como antes, encontramos que 


(p' + w 

ìp' + W 

0 \ 

/«' y 

°\ 

M = hq' + r' 

y + ìí' + y 

p' + W\ 

= W i 

a 'i 

\ o 

w + y 

W + r'ì 

\o \b' 

b'ì 


donde a' = p ; + iq' y b' = iq' + r'. Pero 


a' ~ a 2 + i(2ab) = a(a + b) = a 

y 

ò' = i(2flfc) + ò 2 = 6(a + 6) = b. 

Entonces M = M, y así la distribución de una progenie de segunda gene- 
ración entre los tres genotipos es 


/ û 3 + a 2 b \ / a\a + b) \ 

M(MP) = M 2 P = \a 2 b + ab+ab 2 \ = [ ab(a + 1 + b) J 
\ ab 2 + b 3 j \ b 2 (a + b) j 



que es la misma que la descendencia de primera generación. En otras pala- 
bras, MP es el vector de probabilidad fija para M, y el equilibrio genético 
se alcanza en la población después de sólo una generación. (Este resulta- 
do se llama Ley de Hardy-Weinberg.) Nótese que en el caso especial 
importante donde a = b (o de manera equivalente, donde p = r), la dis- 
tribución en el equilibrio es 


MP = 
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EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Si A £M nxn (C) y lim A m = L, entonces, para cualquier matriz inver- 

tible G€M nxn (C)? lim QA m Q ~ 1 = QLQ~\ 

(b) Si 2 es un eigenvalor de A €AA nxn (C), entonces el lim A m no existe. 

(,c) Un vector m -* î0 


l x A 


e R n 


\xj 


tal que x x + . . . + x n — 1 es un vector de probabilidad. 

(d) La suma de los elementos de cada renglón de una matriz de transi- 
ción es 1. 

(e) E1 producto de una matriz de transición por un vector de probabili- 
dad es tm vector de probabilidad. 

(f) La matriz 

1 0 -1 
0 1 1 
-1 1 0 



(g) 

(h) 

(i) 
(J) 


no tiene a 3 por eigenvalor. 

Toda matriz de transición tiene a 1 por eigenvalor. 

Ninguna matriz de transición puede tener a — 1 por eigenvalor. 
Si A es una matriz /de transición, entonces lim A m existe. 


Si A es una matçíz regular 
y tiene rango 1. 


m-»=° 

de transición, entonces el lim A m existe 

m->°° 


2. Determinar si el lim A m existe o no para las siguientes matrices A. Si el 

m->*> 

límite existe, calcularlo. 


(a) 

(d) 

(g) 
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/-ì ■ 

- 2i 

4/ 

i + 

5i\ 


(i) 1 

1 + 2/ 

—3 i 

-1 - 

4/ 



V-1- 

- 2 i 

4 i 

1 + 

5il 


(j) 

i-26 

3 

+ y 

-28 

3 

4i 

3 


28 \ 



-7 

3 

^ 3 

-5 

3 

+ T 

7 

-2/ 



-13 

6 

+ í 

-5 

6 

+ / 

35 

6 

-'fl 


Demostrar 

que 

si A u 

A 2 , a 

3 , • • 

. es 

una sucesión de matrices de n x p 


con elementos complejos tal que lim A m — L, entonces lim A l m = V 

4. Demostrar que si A £M ni<n (C) es diagonalizable y L = lim A m existe, en- 

tonces L — I n o bien rango(L) < n. m '“ 

5. Encontrar las matrices A y B de 2 x 2 que tengan como elementos a 
números reales tales que lim A m , lim B m y lim (AB) m existen pero 

lim ( AB) m ŷé (lim + m )(lim B m ). 

m-»« m-+°° m- >c ° 

6 . Una unidad de traumatología de un hospital ha determinado que al momen- 
to de llegar al hospital el 30% de sus pacientes es ambulatorio y el 70% 
debe guardar cama. Un mes después de su llegada, el 60% de los pacientes 
ambulatorios se ha recuperado, 20% permanece ambulatorio y 20% ahora 
debe guardar cama. Después del mismo lapso, 10% de los pacientes enca- 
mados se ha recuperado, 20% ahora es ambulatorio, 50% permanece en- 
camado y el 20% ha muerto. Determinar el porcentaje de pacientes que se 
recuperaron, son ambulatorios, están encamados y han muerto un mes des- 
pués de su llegada. También determinar el porcentaje eventual de pacientes 
de cada tipo. 

7. Un jugador principia un juego de azar colocando una ficha en el casillero 2 
(marcada salida). (Véase Fig. 5.4.) Se lanza un dado y la ficha se mueve 
un cuadro a la izquierda si se obtiene 1 o 2 y un cuadro a la derecha si se 
obtiene 3, 4, 5 o 6. Este proceso continúa hasta que la ficha llega al cua- 
dro 1 (en cuyo caso el jugador gana el juego) o en el cuadro 4 (en cuyo 
caso el jugador pierde el juego). ^Cuál es la probabilidad de ganar este 
juego? 


Gana 

Salida 


Pierde 

1 

2 

3 

4 


figura 5.4 
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8 . ^Cuáles de las matrices siguientes son matrices regulares de transición? 


(a) 


(d) 



(b) 


(e) 



(c) 


(f) 


(g) 

o 

o 

O 

(h) 

*+- 

o 

o 


O 

O 

O 


o 

o 

H't 


|U 1 0 


|i * 1 0 


\i i 0 l/ 


\i ì 0 i/ 



9 . Calcular lim A" 

m -+ qo 

cio 8. 


si existe, en cada una de las matrices A del Ejerci- 


10 . Cada una de las matrices siguientes es una matriz regular de transición 
para una cadena de Markov de 3 estados. En todos los casos el vector de 
probabilidad inicial es 



Para cada matriz de transición, calcular la proporción de los objetos en 
cada estado determinando el vector de probabilidad fija. 


(a) /0.6 0.1 0.1\ (b) /0.8 

(0.1 0.9 0.2 0.1 

\0.3 0 0.7/ \o.l 

(d) /0.4 0.2 _ 0.2\ (e) /0.5 

0.1 0.7 0.2 0.2 

\o.5 0.1 0.6/ \o.3 


0.1 

0.2\ 


/0.9 

0.1 

0.1 

0.8 

0.2 

1 (C) 

0.1 

0.6 

0.1 

0.1 

0.6/ 


\ 0 

0.3 

0.8 

0.3 

0.2\ 


/0.6 

0 

0.4' 

0.5 

0.3 

1 (0 

0.2 

0.8 

0.2 

0.2 

0.5/ 


\0.2 

0.2 

0.4, 


11. En 1940 una investigación municipal del uso de la tierra mostró que el 
10% de la tierra del municipio era urbana, el 50% no estaba utilizada y 
el 40% estaba destinada a usos agrícolas. Cinco anos después una investi- 
gación de actualización reveló que el 70% de la superficie urbana había 
permanecido urbana, 10% se había convertido en no utilizada y el 20% 
se había transformado en superficie agrícola. De la misma manera, 20% de 
la superficie no utilizada se había convertido en urbana, 60% había per- 
manecido no utilizada y 20% se había convertido en superficie agrícola. 
Finalmente, la investigación de 1945 mostró que el 20% de la superficie 
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agrícola se había convertido en no utilizada, mientras que el 80% perma- 
neció agrícola. Suponiendo que las tendencias indicadas por la investigación 
de 1945 continuaran, calcular los porcentajes de las superficies urbanas, no 
utilizadas y agrícolas en el municipio en 1950 y los porcentajes eventuales 
correspondientes. 

12 . Se coloca un protector de panal en cada panal utilizado por un bebé. Si 
después de un cambio de panal el protector está sucio, entonces es dese- 
chado; de lo contrario, el protector se lava con los panales y es reutilizado, 
a menos que haya sido usado ya tres veces, en cuyo caso se desecha (aun 
cuando nunca se haya ensuciado). La probabilidad de que un bebé ensucie 
un protector de panales es de un tercio. Si al principio sólo se tienen panales 
nuevos, en un tiempo cualquiera ^qué proporción de los protectores de 
panales serán nuevos, con una utilización y con dos utilizaciones? 

13. En 1965 la industria automotriz determinó que el 40% de los americanos 
poseedores de autos conducía autos grandes, 20% conducía autos de tama- 
no mediano y el 40% conducía autos pequenos. Una segunda investigación 
en 1975 mostró que el 70% de los duenos de autos grandes de 1965 aún 
poseía autos grandes en 1975, pero el 30% había cambiado a autos de 
tamano mediano. De aquellos que poseían automóviles de tamano mediano 
en 1965, 10% había cambiado a autos grandes, el 70% seguía guiando 
autos medianos y el 20% había cambiado a autos pequenos en 1975. 
Finalmente, de los duenos de autos pequenos de 1965, el 10% poseía autos 
medianos y el 90% poseía autos pequenos en 1975. Suponiendo que esta 
tendencia continúe, determinar el porcentaje de americanos que poseerán 
autos de cada uno de Ios tamanòs en 1985 y los porcentajes eventuales 
correspondientes. 


14. Demostrar que si A es tal como en el Ejemplo 21, entonces 


donde 





+ 


2«^i 


Deducir que 


'300\ 

200 + ( ~I )m (100) \ 

200 ] = 

200 

,100/ 

200 + t^P(100), 
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15. Demostrar el Teorema 5.18 y su corolario. 

16. Demostrar los dos corolarios del Teorema 5.21. 


17. Demostrar el corolario del Teorema 5.22. 


Definición. Si AÇM 11X11 (C), se define e A = lim B in , donde 

m ~>» 

A 2 A m 

Bm = I + A + - + ...+—. 

Luego, e A es la suma de la serie infiniía 

A 2 A 3 

I + A+ 2! + 3! + 

y B rn es la suma parcial m-ésima de esîa serie. Nótese la analogía con la 
serie de potencias 

a 2 a 3 

e a =l+a + — + — + ..., 
válida para todo número complejo a. 


18. Calcular e° y e l , donde O e I son respectivamente las matrices nula e 
identidad de n x n. 


19 . Supóngase que P~ X AP es una matriz diagonal D. Demostrar que e A — P~ l e D P . 

20. Sea A €M I1XU (C) diagonalizable. Utilizar el resultado del Ejercicio 19 para 
demostrar que e* 1 existe. (E1 Ejercicio 21 de la Sección 6.2 demostrará 
que e B existe para toda ££M nxu (C).) 

21. Encontrar A , BÇM, x2 (/?) tal que e A e H =£ e A+B . 

22. Demostrar que una función diferenciable X : R -> R n es una solución al 
sistema de ecuaciones diferenciales definido en el Ejercicio 17 de la 
Sección 5.2, si y sólo si X es de la forma X(t) = e tA v para alguna vÇR n , 
donde A es como se define en dicho ejercicio. 


5.4* SUBESPACIOS INVARIANTES 

En la Sección 5.1 observamos que si x es un eigenvector de un operador 
lineal T, entonces T mapea al subespacio generado por (x) en sí mismo. 


* Esta sección no es necesaria en el Capítulo 7. 
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Los subespacios que se mapean en sí mismos son de una gran importancia 
en el estudio de los operadores lineales. 

Definición. Sea T un operador lineal en un espacio vectorial V. Un subespacio 
W de V se llama subespacio T-invariante de V si T(W) C W, esto es 
T(x) £W para toda xÇW. 

Para cualquier operador lineal T en V los subespacios {0} y V son T-in- 
variantes. Estos dos subespacios se Ilaman subespacios T-invariantes impro- 
pios; todos los demás se llaman subespacios T-invariantes propios. 

Es deseable descomponer un espacio vectorial dimensionalmente finito 
V en una suma directa de tantos espacios T-invariantes propios como sea 
posible, puesto que el comportamiento de T puede ser inferido a través de 
su comportamiento en cada uno de los sumandos directos. Si T es diago- 
nalizable, entonces V puede descomponerse en una suma directa de sub- 
espacios T-invariantes unidimensionales, que son los subespacios generados 
por los vectores de la base formada por los eigenvectores de T. (Véase 
Ejercicio 7.) En general no existe tal descomposición. En el Capítulo 6 
consideraremos algunas maneras para descomponer a V en una suma 
directa de subespacios T-invariantes cuando T no sea diagonalizable. En 
esta sección estudiaremos dos propiedades básicas de las sumas directas 
de subespacios T-invariantes. 

Para un operador lineal T en un espacio vectorial V, la restricción de 
T a un subespacio T-invariante W es un mapeo de W en sí mismo. (Véase 
Apéndioe B.) Es fácil demostrar que este mapeo T w es un operador lineal 
en W. (Véase Ejercicio 4.) Nuestro primer resultado relaciona el polinomio 
característico de T w con el de T. 

Teorema 5.24. Sea T un operador lineal en un espacio vectorial dimensional - 
mente finito V, y sea W un subespacio T-invariante de V. Entonces el 
poîinomio característico de T w divide al polinomio característico de T. 

demostración. Extiéndase una base y = {*,, . . . , para W a una 
base J3 - [x u . . . , x*, . . . , x n } para V. Sea A = {Tfe y = [T w ]^. En- 
tonces por el Ejercicio 5 \ 



donde O es una matriz nula de (n — k) x k. Si /(/) es el polinomio ca- 
racterístico de T y g(t) es el polinomio característico de T w , entonces, 
de acuerdo con el Ejercicio 9 de la Sección 4.3, 

f(î) = det(/4 - tl n ) = det (^ l Q ~ rf * ^ __ £ J = g(t) • det (B 3 - tl n . k ). 
Y tenemos que g(t) divide a /(/). ■ 
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Ejemplo 22. Sea T: R 4 —>• R 4 definida mediante 

T ( a, b, c, d) — (a + b + 2c — d, b + d, 2c — d, c + d), 

y sea W = ((/, s, 0, 0): t, s Ç_R). Obsérvese que W es un subespacio T-in- 
variante de R 4 , ya que 

T (a, b, 0, 0) = (a + b, b, 0, 0) ÇW. 

Sea y — {e 1? e 2 } y nótese que y es una base para W. Extiéndase y a la 
base estándar para R 4 . Entonces 

i' ■ 2 -■) 

|o 1 0 1' 

y A = m, = 


= [Tw], — 


-U 


0 0 2 
\0 0 1 


-1 

1/ 


de acuerdo con la notación del Teorema 5.24. Luego, si /(<) es el poli- 
nomio característico de T y g(t) es el polinomio característico de T w , 
entonces 


n-t 


f(t ) = det(^ — tlf) = det^ 


0 

0 

0 


1 

1 - t 
0 
0 


2 _1 \ 

0 1 

2 - t -1 

1 1 -tl 



— t 
0 



-1 


1 - 


,)• 


E1 siguiente teorema muestra que si V es la suma directa de subespacios 
T-invariantes, entonces el polinomio característico de T está completamente 
determinado por los polinomios característicos de las restricciones de T 
para cada uno de los sumandos directos. 

Teorema 5.25. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y supóngase que V — Wi © . . . © W k , donde Wi es un 
subespacio T-invariante de V para toda i(l < i < k). Si f(t) es el polino- 
mio característico de T y fi(t) es el polinomio característico de T Wi (l < 
< i < k), entonces 

f(t) f i (t) * f 2 (t) ... *f k (t). 

demostración. La demostración se hará por inducción sobre k. Supón- 
gase primeramente que k = 2. Sea una base para W l5 p 2 una base para 
W 2 y P = pi U pi Entonces J3 es una base para V. Sean A — [T]^, B x = 
— [T^J^r y B 2 — [T w J| 3 a . Se ve fácilmente por el Ejercicio 5 que 
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donde O y O' son matrices nulas. Por lo tanto, por el Ejercicio 9 de la 
Sección 4.3, 

f(t) - det (A - tl) = detí^ - tl) -det(fl 2 - r/) - /,(/) • f 2 (t) 

lo que demuestra el resultado si k = 2. 

Ahora supóngase que el teorema es cierto para k — 1 sumandos, don- 
de k — 1 es algún entero mayor o igual a 1. Supóngase que V es una suma 
directa de k sumandos, 

V = ... ©W*, 

y defínase W = W x + W 2 + ... + W*_!. Puede verificarse fácilmente que 
V-W® W fc . Así, por el caso para k = 2, /(0 = g(0 * /*(0, donde 
g(/) es el polinomio característico de T w . Claramente se tiene que W = 
W, ® W 2 © • * • © W,_,. Por tanto por la hipótesis de inducción tene- 
mos que g(t) = U(t) */ 2 (/) ... f h - x (t). Entonces /(/) = g(t) • f h (t) = 

= W) •/*(/)•... -h(t). u 

Si T es un operador lineal diagonalizable en un espacio vectorial n-di- 
mensional V para el cual los eigenvalores distintos son X u A 2 , . . . , X k , 
entonces por el Teorema 5.14 V = E Xì @ E Xt © • • * © E^. Se ve claramen- 
te (véase Ejercicio 3) que cada Ea { es T-invariante y la restricción de T 
a Eaì tiene como polinomio característico a (Xi — t) m \ donde nii es la 
multiplicidad de Xi. Por tanto, dentro de este contexto, el teorema anterior 
arroja la conclusión evidente de que el polinomio característico de T es 
(Xi - t) m *(X 2 - /) W2 ... (A& -\/) w * = (— 1 ) w (/ - - A 2 ) Wl . . . 

. • • (t ~ A*)*+ 

La siguiente aplicación del Teorema 5.25 sugiere otro resultado sobre 
las sumas directas. 

Ejemplo 23. Sea T: R 4 —» R 4 definida mediante 

T (a, b, c , d) = (2 a — b, a + b, c — d, c + d), 

y sean W^ — {(.y, t, 0, 0): s, t£R) y W 2 = {(0, 0, t): s, t ÇjR}. Nótese 

que Wj y W 2 son ambos T-invariantes y que R 4 — Wi © W 2 . Sean = [e u 
e 2 ), p 2 — [e s , e 4 } y p — [e u e 2 , e :] , e 4 ). Entonces es una base para 
W 1# p 2 es una base para W 2 y (3 es una base para R 4 . Si B x = [TvvJ^, B 2 = 
= [Tw,W y A = [T]^, entonces 



y 

2 — 1 0 0 \ 

1 10 0 

0 0 1 - 1 * 

,0 0 1 1 / 


B, 0\ = 

o bJ 
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Además, si f(t) es el polinomio característico de T, f x (t ) es el polinomio 
característico de T Wl y f>(t) el polinomio característico de T w ,, entonces 

f(t) = det (A - tl) = det (B, - tï) -det(B 2 - tl) = U(t)-f 2 (t). 

La matriz A del ejemplo anterior puede obtenerse uniendo las matrices 
B x y B 2 de la manera explicada en la definición siguiente. 


Definición. Sean B, y B 2 nmtrices cuadradas (no necesariamente del mìsmo ta- 
mano) que tengan elementos del mismo campo. Si B, es una matriz de 
m x m y B 2 es una matriz de n x n, entonces la suma directa de B^ y 
B 2 , representada por Bi 0 B 2 , es la matriz A de (m + n) x (m + n) tal 
que 


Aij — < 


(BOu 

(B 2 ) (i-m), (j-ni) 

0 


para 1 < i, j < m 

para m+l<i, j<n + m 

en cualquier otro caso. 


Si B,, B 2 , . . . , B k son matrices cuadradas con elementos del mismo cam- 
po, entonces definimos la suma directa de B,, B 2 , . .. , B k recursivamente 
mediante B, 0 B 2 © . .. © B* = (B, 0 B 2 ® . .. 0 B^) ’© B k . Si A - 
= Bi 0 Bjj Q . . . 0 B k , escribiremos a menudo 


/B, O ••• Ox 

o b 2 ... oI 


\0 O ••• B J 


Ejempio 24. Sean 


B , = 


(i 



n 2 i\ 

B 2 = (3) y B 3 = I 1 2 3). 


Entonces 


B\ 0 B 2 0 B 3 



2 

0 

0 

0 

0\ 

1 

1 

0 

0 

0 

0 

0 

0 

3 

0 

0 

0 

0 

0 

0 

1 

2 

1 

0 

0 

0 

1 

2 

3 


0 

0 

1 

1 

l/ 


E1 resultado final de esta sección relaciona las sumas directas de matri- 
ces con las sumas directas de subespacios invariantes, y enuncia el caso 
general de la relación entre las matrices A, B x y B 2 del Ejemplo 23. 
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Teorema 5.26. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y sean W 1? W 2 , . .. , W k subespacios T-invariantes de V 
tates V ~ Wj © W 2 © • • • © W k . Para cada i, sea /3 x una base para 
Wiy^ = ftU^U ... U jB k . 5/ A = [T]* Mi = [T Wl k pam i = 1, 
2, . . . , k, entonces A = A t © A 2 © ... © A&. 

de mostrac ión . Ej er cicio. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Existen operadores lineales T que no tienen subespacios T-invariantes. 

(b) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito V y W es un subespacio T-invariante de V, entonces el polino- 
mio característico de T w divide al polinomio característico de T. 

(c) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito V y si V es una suma directa de subespacios T-invariantes, en- 
tonces existe una base fi para V tal que [TJp es una suma directa de 
matrices. 

2. Para cada uno de los siguientes operadores lineales T, determinar si el sub- 
espacio dado W es un subespacio T-invariante de V. 

(a) Sea T el operador en V — P 3 (R) definido mediante T(/) = /', la deri- 
vada de /, y W = P 2 (fl). 

(b) Sea T el operador en V = P(R) definido mediante T(/(jc)) = xf(x ) 
y W= P 2 (R). 

(c) Sea T el operador en V = R 3 definido mediante 

T(fli, a 2 , a 3 ) = (a x + a? + a 3 , a x + a 2 + a 3 , a x + a 2 + a 3 ) 

y 

W = {(/, t, t): t£R). 

(d) Sea, T el operador en el espacio vectorial V de funciones continuas de 
valor real en [0, 1] definido mediante 

T(/)(*) = j(x)dx~}^t y W = {/€V: f(t) = at + b para al- 

gunas a , b £R y toda 0 < t < 1}. 

3. Sea T un operador lineal en un espacio vectorial dimensionalmente fini- 
to V. 

(a) Demostrar que (0) y V son subespacios T-invariantes de V. 

(b) Demostrar que N(T) y R(T) son subespacios T-invariantes de V. 
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(c) Demostrar que si A es un eigenvalor de T, entonces E\ es un subespa- 
cio T-invariante de V y la restricción de T a Ex es XI. 

(d) Si W l5 W 2 , . . . , W fc son subespacios T-invariantes de V, demostrar 
que 

t W, y íV, 

/=i 

son subespacios T-invariantes de V. 

4. Sea T un operador lineal en un espacio vectorial dimensionalmente finito 
V y sea W un subespacio T-invariante de V. 

(a) Demostrar que T w es un operador lineal en W. 

(b) Demostrar que si A es un eigenvalor de T w entonoes À es un eigen- 
valor de T. 

(c) Demostrar que si x es un eigenvector de T w entonces * es un eigen- 
vector de T. 

5. Verificar que en la demostración del Teorema 5.24 



y que en la demostración del Teorema 5.25 



6 . Demostrar el Teorema 5.26. 

7* Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demostrar que T es diagonalizable si y sólo si V es una suma directa de 
subespacios T-invariantes unidimensionales. 

8. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 

y sean W 3 , W 2 , . . . , W^ subespacios T-invariantes propios de V tales que 
V=Wj © W 2 ® • • * © W*. Demostrar que det(T) = det(T Wl )-det(T Wî ). 

det(T Wjt )- 

9. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V, 
y supóngase que W 1? W 2 , . . . , W* son subespacios T-invariantes de V tales 
que V = Wj © W 2 © • • • © W*. Demostrar que si T Wl es diagonalizable 
para cada i, entonces T es diagonalizable. 

10. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 

(a) Demostrar que si el polinomio característico de T se descompone como 
un producto de factores de grado 1, lo mismo ocurre con el polinomio 
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característico de la restricción de T a cualquier subespacio T-inva- 
riante de V. 

(b) Deducir que si el polinomio característico de T se descompone en 
un producto de factores de grado 1, entonces cualquier subespacio T- 
invariante no nulo de V contiene un eigenvector de T. 

(c) Sea W cualquier subespacio T-invariante de V. Demostrar que si A 
es un eigenvalor de T w entonces el eigenespacio de T w correspon- 
diente a A es E\ n W, donde Ea es el eigenespacio de T correspondien- 
te a A. 

(d) Sea W cualquier subespacio T-invariante de V. Demostrar que si T 
es diagonalizable, también lo es T w . Sugerencia: Utilizar los incisos 
(a) y (c) y el Teorema 5.14. 

11. (a) Demostrar un recíproco del Ejercicio 19(a) de la Sección 5.2: Si T 

y U son operadores lineales diagonalizables en un espacio vectorial 
dimensionalmente finito tales que UT — TU, entonces T y U son 
simultáneamente diagonalizables. Sugerencia: Sean Aj, A 2 , . . . , X h 
los distintos eigenvalores de T y sean Ea, (/ = 1, 2,. . k) los co- 
rrespondientes eigenespacios de T. Demuéstrese que cada Ea< es U- 
invariante y utilícese el Ejercicio 10(d) para obtener una base para 
Ea^ formada por eigenvectores de U. 

(b) Enunciar y demostrar la versión matricial del inciso (a). 

12. (a) E1 resultado del Ejercicio 11 (a) puede ser generalizado de la mane- 

ra siguiente: Sea V un espacio vectorial dimensionalmente finito. 
Se dice que una colección 6 de operadores lineales diagonalizables 
en V es simultáneamente diagonalizabîe si existe una /3 para V tal 
que [T]^ es una matriz diagonal para cada T Ç 6. 

Demostrar que una colección C de operadores lineales diagonali- 
zables en un espacio vectorial dimensionalmente finito V es simultá- 
neamente diagonalizable si y sólo si UT = TU para toda T, U£6. 
Sugerencia: En el caso de que UT = TU para toda T, U Ç e, esta- 
blézcase primero el resultado cuando cada operador en e tenga úniça- 
mente un eigenvalor. Luego establézcase el resultado general mediante 
inducción sobre dim(V) utilizando. el hecho de que V puede expresarse 
como la suma directa de los eigenespacios para algún operador en e. 

(b) Enunciar y demostrar la versión matricial del inciso (a). 

Los Ejercicios 13 y 14 requieren que el lector esté familiarizado con el 

Ejercicio 29 de la Sección 1.3. 

13. * Sea T un operador lineal en V y sea W un subespacio T-invariante de V. 

Defínase 

T: V/W —> V/W por T(v + W) - T(v) + W. 
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Demostrar que T está bien definido; esto es, demostrar que T(v + W) 
es independiente de la selección de v en el coconjunto de v + W. 
Demostrar que T es un operador lineal en V/W. 

Defínase 

r/'. V —» V/W por 7 )(v) = v 4 W. 

Demostrar que r; es una transformación lineal con espacio nulo W 
y rango V/W. 

Demostrar que el diagrama de la Fig. 5.5 es conmutativo; esto es 
rçT = Tiy. 



figura 5.5 


14. (a) Sea T un operador lineal en un espacio vectorial dimensionalmente 

finito V, y sea W un subespacio T-invariante propio de V. Sean f(t), 
g(t) y h(t) los polinomios característicos de T, T w y T (tal como 
se definió en el Ejercicio 13), respectivamente. Demostrar que f(t) — 
— g(t)h(t). Sugerencìa: Extender una base y = (x,, . .. , **} para 
W a una base /3 = {*„ . .. , x k , . .. , x n ) para V. Mostrar que [T] p 
es de la forma 



que J3 = {x ktl + W, . . . , x» + W), es una base para V/W, y que 
[T] 3 - B,. 

(b) Utilizar el Ejercicio 13 para demostrar que si T es diagonalizable, 
también lo será T. 

5.5* EL TEOREMA DE CAYLEY HAMILTON 

En la Sección 5.4 mencionamos que si T es un operador lineal en un espacio 
vectorial dimensionalmente finito V, entonces es deseable descomponer a V 
en una suma directa de tantos subespacios T-invariantes como sea posible. 
Cuando el polinomio característico de T se descompone en un producto 
de factores de grado 1, demostraremos en la Sección 6.1 que V puede 

* E1 material de esta sección es necesario para las Secciones 5.6 y 6.3, pero 
no para las Secciones 6.1 y 6.2. 


(a) 

(b) 

(c) 

(d) 
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descomponerse siempre en una suma directa de los “eigenespacios genera- 
lizados” de T. De hecho, cuando T es diagonalizable, ésta es precisamente 
la descomposición dada en el Teorema 5.14. Sin embargo, si el polinomio 
característico de T no se descompone en un producto de factores de gra- 
do 1, entonces T puede incluso no tener eigenvalores. En este caso no 
podemos esperar descomponer a V en una suma directa como antes. No 
obstante, una descomposición de V en subespacios T-invariantes es aún 
posible. En esta sección definiremos el tipo especial de subespacios T-inva- 
riantes necesarios para esta descomposición y los emplearemos para demos- 
trar uno de los más famosos teoremas del álgebra lineal, el teorema de 
Cayley-Hamilton. 

Definiciones . Sea T un operador lineal en un espacio vectorial V. Un subespacio 
W de V se llama subespacio T-cíclico si existe un elemento x£W tal que 
W es igual al subespacio generado por {x, T(x), T 2 (x), . . .}. En este caso 
decimos que W es generado por x. El subespacio T-cíclico generado por x 
será representado por C x . 

Ejempfo 25. Sea T: R 3 R 3 definido por 

T (a, b, c) — (~b + c, a + c, 3c). 

Determinaremos el subespacio T-cíclico generado por = (1, 0, 0). Como 
T(e x ) - T( 1, 0, 0) = (0, 1,0) - e 2 y T 2 (e0 = T(T(e x )) = T(e 2 ) = 
= (~h 0, 0) = -e u entonces = L({e 1? T(e x ), T 2 ^),.. .}) = 
= L({e u e 2 }) = {(.y, t y 0): s, t£R). Nótese que para esta transforma- 
ción C ei = C e . 2 . 

Ejemplo 26. Sea T el operador lineal en P (R) definido mediante 
T(/) = /'. Entonces C x .= es igual al subespacio generado por {jc 2 , 2x, 2} e 
igual a P n(R). 

Puede verse fácilmente que los subespacios T-cíclicos son T-invarian- 
tes. Nuestro siguiente resultado establece algunas propiedades adicionales 
de los subespacios T-cíclicos. 

Teorema 5.27. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y sea W el subespacio T -cíclico de V generado por x£V. 
Supóngase que dim( W) = k > 1 (y por tanto x^Oj. Entonces 

(a) {x, T(x), T 2 (x), . . . , T k l (x)} es una base para W. 

(b) Si -a 0 , — a 1? . . . , — a^ son los escalares dados por (a) tales 
que T k (x) = -a^x - aj(x) - ... - a^J^Jx) entonces 
f(t) = ( —l) k (ao + a^t + ... + aic-jt 1 * -1 + t k ) es el polinomio 
característico de T w . 
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demostración. Sea j el entero más pequeno para el que {jr, T(jc), . . . , 
T y '(jr)} es linealmente independiente. (Tal j debe existir porque W es di- 
mensionalmente finito.) Como x 0, j> 1 . Por tanto {jc, T(jc), ... , 
T' '(.r)} es linealmente independiente y T y (jc) £L({x, T(jc), . . .T' 1 (jc)}) 
de acuerdo con el lema del Teorema 1.10. Demostraremos por inducción 
matemática que T v (jc) está dentro de este subespacio para cualquier entero 
no negativo .v. Esto es evidente para 0 < s < /. Supóngase que J tn (x) per- 

tenece al subespacio generado por {(jc, T(jc).T' ’(jc)} para alguna 

m > j. Entonces existen escalares /?<„ £?,, . . . , 6, , tales que 

J r,, (x) ■- bnX r fr.T(jc) f ... f b, ,T' ’(jc). 

Aplicando T a ambos lados de Ia igualdad anterior, obtenemos 

T- '(jc) - bj(x) I biJ-(x) I ... f b }l T'(jc). 

Luego T wm, (jc) es una combinación lineal de T(t), T-(x), ... , T ; '(jc), 
cada uno de los cuales pertenece al subespacio generado por { x , T(x), . . . , 
T ; 1 (jc) }. Entonces T WM (jr) pertenece a este subespacio completando la in- 
ducción. Por tanto 


W - L({x, T(jc), T(jc), . . . ,} Ç L({j c, J(x) .T' ^jc)}). 


Pero claramente se ve que Ia inclusión recíproca es también cierta y por 

lo tanto {jc, T(jc).T' 1 (jc)} genera a W. Como este conjunto es tam- 

bién linealmente independiente, es una base para W. Pero dim(W) - k\ 
de manera que este conjunto debe contener k elementos. Por lo tanto j — k 
y entonces { x , T(jc), ... , J k 1 (jc)} es una base para W, lo que demuestra 
el inciso (a). 

Para demostrar (b), sea /3 — {x, T(x), . . . , J k '(.*)} la base del inci- 
so (a) y sean c/ 0 , a,, . . . , -a k , escalares tales que T A (*) — 
— -«„jc - c/,T(jc) . . . a k J k *(x). Obscrvese que 


/0 0 
1 0 
0 1 


P"w]/î — 


0 -a 0 \ 

0 —a { 

0 —a 2 


I 0 0 • 0 a k _ 2 I 

\0 0 ... 1 -a k .J 


y entonces el polinomio característico de [T w ] ( * es 


f(î) (I ) k (a„ i aj í ... i a k 1 i t h ) 


por el Ejercicio 10, por lo que f(t) es el polinomio característico de T w 
demostrando así el inciso (b). ■ 
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Definición. En la demostración del Teorema 5.27, la rnatriz 



/0 0 ••• 

0 

-a 0 \ 


1 0 • • • 

0 

~a x 


0 1 ••• 

0 

~a 2 

P"wl/? — 

• 


* 


0 0 •■• 

0 

~a k - 2 


^O 0 ••■ 

1 

~a k -J 

se llama matriz companera del polinomio 




f(t) - ( — 1 ) k (a 0 + M + . .. + a^- 1 + t k ). 

Ahora podemos demostrar el célebre teorema de Cayley-Hamilton. 
E1 lector deberá consultar el Apéndice E para la definición de /(T) cuan- 
do T es un operador lineal y /(/) un polinomio. 

Teorema 5.28. ( Cayley-Hamilton.) Sea T un operador lineal en un espacio vec- 

torial dimensionalmente jinito V y sea f(t) el polinomio característico de 
T. Entonces f(T) ~ T 0 (la transformación nula); o sea que T satisface a su 
polinomio característico. 

demostración. Debemos demostrar que /(T)(jc) — 0 para toda x£V. 
Si x = 0 entonces /(T)(*) = 0 puesto que /(T) es una transformación 
îineal. Supóngase entonces que x =£ 0 y sea W = C x . Si dim(W) = k, en- 
tonces, de acuerdo con el Teorema 5.27, existen escalares — a 0 , —a,, ... , 
—a k -i tales que 

T fc (j:) = ~a 0 x - aj(x) - ... - a k -J^Jx). 

Por lo tanto el Teorema 5.27 implica que 

g(0 = (~l) fc (a 0 + aj+ . . . + + t fc ) 

es el polinomio característico de T w . Combinando estas dos ecuaciones te- 
nemos 


g(T)(x) - (~l) k (a 0 \ +aj+ ... + Ojç-il* 1 + T*)(x) = 0. 

De acuerdo con el Teorema 5.24, g(t) divide a f(t); por lo tanto existe 
un polinomio q(t) tal que f(t) = q(t)g(t), y entonces 

f(T)(x) = q(T)g(T)(x) = ?(T)(s(T)(;c)) = q(T)(0) = 0. ■ 


Ejemplo 27. Sea T: R 2 —> R 2 definida mediante T(a, b) = (a + 2b, 
— 2a + b) y sea /3 = {e l9 e 2 }. Entonces 


A = 
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donde A — (T1 ,j. Por lo tanto el polinomio característico de T es 


f(t ) = det(/í — tl) — det 


C-V ■-')= 


t- - 2t + 5. 


Se puede verificar fácilmente que T u = /(T) = T 2 — 2T + 5. Del mismo 
modo 


f(A) 


(:î -i) + n =Í)-G î) 



Ejemplo 28. Sea T el operador lineal en P 2 (fl) definido mediante 
T(/) =/' + /. Se ve fácilmente que el polinomio característico de T es 
g(t) = (1 — 0 3 — — t 3 + 3t 2 — 3t + 1. Ahora bien, 


y 

Por lo tanto 


T 2 (/) - T(/' + /) = /" +2/' + / 
T 3 (/) - /'" + 3/" + 3/' + /. 


*(T)(/) = T 3 (/) + 3 V(f) - 3T(/) + I(/) = -/"'. 

Pero para /£P 2 (fl), /'" = 0. Por lo tanto g(T) = T 0 . 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Sean C x y C v subespacios T-cíclicos de un operador lineal T en un 

espacio vectorial dimensionalmente finito V. Si C x = C ?/ , entonces 

x = y. 

(b) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito, entonces C x = C T{ . r) . 

(c) Sea T un operador lineal en un espacio vectorial A7-dimensional. Existe 
un polinomio g(t ) de grado n tal que #(T) — T 0 . 

(d) E1 polinomio característico de la matriz companera de g(t) = 

= (— 1 ) fc (a 0 + aj + ... + a k - x t k l + t k ) es g(t). 

(e) Un poîinomio de la forma ( — í) k (a 0 + a x t + ... + + t k ) 

es el polinomio característico de algún operador lineal. 

2. Encontrar una base para el subespacio T-cíclico C~ en cada uno de los inci- 

sos siguientes. 

(a) T: R 4 -^ R 4 definida mediante T(a,, a 2 , a Á , a x ) — (a x + a 2 , a 2 ~~ a 3 , 
a L + a 3 , + a 4 ) y z = 
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(b) 

(c) 

(d) 


T: P 3 (/ï) —> P 3 (/î) definida mediante T(/) — /" y z — x'. 
T: M 3x= (/?)—> M 3x:! (fî) definida mediante 


T(/4) = A> y z 


G !)• 


T: M l . x2 (/?)—> M^ 2 (/?) definida mediante 


^ » -(i ?)■ 


3. Para cada uno de los operadores lineales T del Ejercicio 2. 

(i) Calcular el polinomio característico de T, (% . 

(ii) Calcular el polinomio característico de T. 

(iii) Verificar el teorema de Cayley-Hamilton para T. 


4. 


Sea T: V —» V un 
es T-invariante. 


operador lineal, demostrar que para cualquier *CV, C r 



5. Demostrar el teorema de Cayley-Hamilton para matrices: Si A es una matriz 
de n x n, de polinomio característico /(/), entonces f(A) — q es îa matriz 
nula de n x n. 


6. Sea V un espacio vectorial bidimensional y sea T: V —> V un operador li- 
neal. Demostrar que V es un subespacio T-cíclico de sí mismo o bien 
T — Al para algún escalar A. 

7. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V, 
y sea /(/) = ( — 1) M / M -f a n it n l + ... + a { t + a n el polinomio caracterís- 
tico de T. Demostrar que 

(a) T es invertible si y sólo si a {) /~ 0. 

(b) Si T es invertible, entonces 


a n a n a ( i 

8. Sea T un operador lineal en un espacio vectorial V, y sea W un subespacio 
T-invariante de V. Demostrar que para cualquier polinomio g(t), W es 
^(T)-invàriante. 

9. Sea T un operador lineal en un espacio vectorial V. Demostrar para cual- 
quier x£V, que el subespacio T-cíclico C.,. es el subespacio T-invariante más 
pequeno de V que contiene a esto es, para cualquier subespacio T-inva- 
riante W que contenga a x, C., C W. 
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10. Sea A la matriz de k x k 

0 0 • • • 0 
1 0 ... 0 
0 1 ... 0 


0 0 ••• 0 
0 0 ... 1 

donde a 0 , a„ , n*., son escalares cualesquiera. Demostrar que el poli- 
nomio característico de A es 

( - 1 + a,i + ... + a,- ,+‘ + f). 

Sugerencia: Utilizar inducción sobre k. 

11. Utilizar el Ejercicio 22 de la Sección 5.1 para obtenèì^una demostración 
fácil del teorema de Cayley-Hamilton para operadores diagonalizables. 

12. Sea T un operador lineal en un espacio vectorial n-dimensional V. Demos- 
trar que el subespacio generado por {I, T, T-, . . .} es un subespacio de £(V) 
cuya dimensión no excede a n. 


5.6* EL POLINOMIO MINIMO 

Para un operador dado T en un espacio vectorial dimensionalmente finito 
V, el teorema de Cayley-Hamilton muestra que existe un polinomio /(/) 
para el cual /(T) — T 0 , que es el polinomio característico de T. Existen 
muchos otros polinomios que tienen esta propiedad. Uno de los más im- 
portantes, el polinomio mínimo, proporciona otro medio para estudiar a 
los operadores lineales. 

Definición. Sea T un operador lineal en un espacio vectorial V. Un polinomio 
p(t) se Itama polinomio mínimo para T si p(t) es un polinomio mónico de 
grado positivo núnimo para el cual p(T) -- T 0 . (Recuérdese del Apéndice E 
que un polinomio mónico es aquel en el cual el coeficiente principal es 
I.) 

Es fácil ver que cualquier operador lineal T en un espacio vectorial 
dimensionalmente finito tiene un polinomio mínimo. Nótese que si g(t ) 
es un polinomio de grado k con coeficiente principal a tal que g(T) = T 0 , 
entonces h(t) — (1 /a)g(t) es un polinomio mónico de grado k para el 
que h( T) — T„. Por lo tanto el teorema de Cayley-Hamilton muestra que 



Fsla sección se requiere únicamente para la Sección 6.3. 
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el grado de un polinomio mínimo para T es a lo más igual a la dimensión 
del espacio vectorial en el que T está definido. E1 resultado siguiente mues- 
tra que el requerimiento de que un polinomio mínimo sea mónico garantiza 
que sea único. 

Teorema 5.29. Sea p(t) un polinomio minimo para un operador lineal T en un 
espacio vectorial dimensionalmente iinito V. 

(a) Si g(t) es un poîinomio cualquiera para el cual g(T) — T 0 , en- 

tonces p(t) divide a g(t). En particuiar, p(t) divide al polinomio 
característico de T. 

(b) Existe únicamente un polinomio mínimo para T; esto es, p(t) 
es único. 

DEMOSTRACIÓN. 

(a) Sea g(t) un polinomio cualquiera para el cual g( T) ==\T 0 . E1 al- 
goritmo de la división para polinomios (véase Apéndice E) implica que 
existen polinomios q(t) y r(t) tales que 

8(0 - QÌOPÍO + r(t) y 

donde r(t) es de grado menor que p(t). Sustituyendo a T en la ecua- 
ción (8) y usando el hecho de que g( T) « p(j) — j 0y tenemos que r(T) = 
— T 0 . Como r(t) es de grado menor que p(t) y p(t) es un polinomio 
mínimo, r(t) debe ser el polinomio nulo. Luego la ecuación (8) se con- 
vierte en g(t) = q(t)p(0 demostrando (a). 

(b) Supóngase que p x (t) y p 2 (t) son cada uno polinomios mínimos 

para T. Entonces de acuerdo con el inciso (a) p x (t) divide a p 2 (t )• Pero 
como Pi(t) y p 2 (t) tienen el mismo grado no negativo, debe de tenerse que 
Pi(0 i— kp>(t) para algún escalar no nulo k. Además, como p x (t) y p 2 (t) 
son mónicos, & = 1, por lo que p x (t) — p 2 (t). ■' 

Antes de continuar con nuestro estudio del polinomio mínimo para un 
operador, introduciremos el concepto de polinomio mínimo para una 
matriz. 

Definición . El polinomio mínimo p(t) para A £M JJXI1 (F) es el polinomio mó - 
nico de grado positivo mínimo para el que p(A) es igual a la matriz nula. 

A lo largo de este libro, los enunciados sobre transformaciones lineales 
han sido traducidos en enunciados sobre matrices y viceversa. E1 siguiente 
teorema y su corolario son de este tipo. 

Teorema 5.30. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V y sea p una base para V. Entonces el polinomio mínimo 
para T es el mismo que el polinomio mtnimo para [T]p. 

de M ostrac ión . Ej e r c icio. 
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Corolario. Para cualquier A ÇM nxll (F), el polinomio mínimo para A es el mis- 
mo que el polinomio mínimo para L\. 

demostración. Ejercicio. 

Como consecuencia del teorema anterior y su corolario, los teoremas 
siguientes de esta sección que se enuncien para operadores son también 
válidos para matrices. 

En el resto de esta sección estudiaremos principalmente polinomios 
mínimos para operadores cuyos polinomios característicos se descomponen 
en un producto de factores de grado 1. En la Sección 6.3 se hará un 
estudio más detallado de los polinomios mínimos. 

Teorema 5.31. Sea T un operador lineal en un espacio vectorial dimensional- 
mente finito V, y sea p(t) el polinomio mínimo para T. Un escalar \ es 
un eigenvalor de T si y sólo si p(A) 0. Por lo tanto el polinomìò\carac- 

terísfico y el polinomio mínimo para T tienen los mismos ceros. 

demostración. Sea /(/) el polinomio característico de T. Como p(t) 
divide a /(/), /(/) q(t)p(t) para algún polinomio q(t). Sea \ un cero 
de p(t). Entonces 

f(\) - q(\)p( A) = q(\) ‘0 — 0. 

Por lo que \ es también un cero para /(/); esto es, \ es un eigenvalor de T. 

Recíprocamente, supóngase que \ es un eigenvalor de T y sea xÇV 
un eigenvector correspondiente a \. Entonces, por el Ejercicio 22 de la 
Sección 5.1, tenemos que 

0 - To(jc) = p(T)(x) - p(\)x. 

Como x -/ 0, p(\) --- 0 y por lo tanto \ es un cero para p(t ). H 

Como una consecuencia inmediata del resultado anterior tenemos el 
corolario siguiente. 

Corolario. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V con polinomio mínimo p(t) y con polinomio característico f(t). 
Supóngase que f(t) se factoriza como 

f(t) - (\i - t)"»(** “ t) 112 • • • (** - t) nk , 

donde A„ A,>, . . . , A k son los distintos eigenvalores de T. Entonces existen 
enteros m„ m 2 , . . . , mi v tales que 1 < m^ < ni para toda i y 

p(t) = (t - A L ) mi (t “ A a ) ln ’ ... (t - Ak) ,nk . 
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Ejemplo 29. Calcularemos el polinomio mínimo para la matriz 


/ 3 °\ 

A = 0 2 0 • 

\l -1 2/ 

Como el polinomio característico de A es 
/3 — / -1 0 \ 

/(0 = det 0 2 - / 0 !=-(/- 2)\t - 3), 

\ 1 -1 2 — t/ 


el polinomio mínimo para A debe ser, de acuerdo con el corolario del 
Teorema 5.3! (/ 2)(/ - 3), o bien (/ 2)-(/ 3). Al sustituir A 

en //(/) (/ 2)(/ 3) se demuestra que p(A ) es la matriz nula; lue- 

go, //(/) es el polinomio mínimo de A. 

Ejemplo 30. Sca T: R-—* R- definida mediante 

T(«, b ) (2 a I 5 b. 6 a I />). 

Si (ì es la base estándar para R-, entonces 


[Tlfì 


e o- 


Así el polinomio característico de |T| (1 , y por tanto de T, es 


f(l 


> dct ( 2 6 ' I 5 /) 


(/ 7)(f I 4). 


Y entonces el polinomio mínimo para T dehe ser (/ 7)(/ ! 4). 


Ejemplo 31. Sea D: P..(R ) —» P,(R ) el operador de diferenciación de- 
finido mediante D(/) f'. Calcuiaremos el polinomio mínimo para D. Para 

Ia base ft { 1, /, /-} tenemos que 

/° 1 °\ 

[D],== 0 0 2 • 

\o 0 0/ 

Por lo tanto el polinomio característico de D es r\ y el corolario al 
Teorema 5.31 muestra que el polinomio mínimo para D es /, /- o / ! . Como 
D J (/ J ) 2 ./ 0, D J / T„, por lo que el polinomio mínimo para D debe 
ser / ; . 

En el ejemplo anterior es fácil verificar que P,(/?) es un subespacio 
D-cícIico (de sí mismo). En este ejemplo vimos que los polinomios mínimo 
y característico fueron del mismo grado y esto no es ninguna coincidencia. 
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Teorema 5.32. Sea T un operador lineal en un espacio vectorial dimensional- 
mente jinito V. Si V es un subespacio T -cíclico, o sea, si V C v para al- 
guna x £ V, entonces el polinomio caracteristico f(t) y el polinomio mínimo 
p(t) para T son del mismo grado. Por lo tanto f(t) ( I ) 7, p(t). 

demostración. Si V es un subcspacio T-cíclico, entonces existe un ele- 
mento .v Ç V tal que 

ft {.v, TU).T" 'U)} 

es una base para V (Teorema 5.27). Sea 

#(/) í fl,/ ! . t 

donde au / 0 y 0 < A < //. Entonces 

ÍT( T ) (A') Íi,,v I a { TU) t ... ! «jJ ; ‘(.v) 

es una combinación lineal de clementos de ft que tienen al menos un 
coeficientc no nulo, el cual supondremos que es a, K . Como ft es linealmente 
independiente, íf(T)(jr) / 0 y por îo tanto tf(T) / T„. Y así el polinomio 
mínimo para T es de grado n , que es tambien el grado deì polinomio carac- 
terístico de T. ■ 


E1 Teorema 5.32 enuncia una condición bajo la cual el grado del poli- 
nomio mínimo para un operador es tan grande como posible. Investigare- 
mos ahora cuándo cl grado del polinomio mínimo es tan pequeno como 
posible. Se tiene del Teorema 5.31 que si el polinomio característico de 
un operador con k eigenvalores distintos se dcscomponc como el producto 
de factores de grado I, entonces el polinomio mínimo debe sei al menos de 
grado k. E1 siguiente teorema muestra que los operadores para los cuales 
el grado del polinomio mínimo es tan pequcno como posible son precisa- 
mentc los operadores diagonalizables. 

Teorema 5.33. Sea T un operador lineal en un espacio vectorial dimensional - 
mente jinito V. Entonces T es diagonalizahle si v sólo si el poìinomio míni - 
mo para T es de la forma 

p(t) (t À ,)(t À,) . .. (t À,), 

dotule À,, À„ . . . , À k son escalares distintos. (Nótese que À,, À,, . . . , À k 
son necesariamente los distintos eigenvalores de T.) 

demostrac'IÓN. Supóngase que T es diagonalizable y sean À,, À,, . . . , Xl 
los distintos eigenvalores de T con eigenespacios correspondientes Ea,. 

Ea,..., Ea*. Si dim ( Ea, ) n,(i 1, 2. k ), entonces el polinomio 

característico de T, /(/), es 

/(/) ( à, /) W *(À, /.)"*■ • • • ( à/, /) Mt . 
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Sea p(t) el polinomio mínimo de T y defínase 

q(t) = (t - k,)(t - X,) ... (t - X*). 

Demostraremos que q(l) — T„. Como de acuerdo con el Teorema 5.31 
q(t) divide a p(t), se tendrá que p(t) — q(t). Recuérdese que para cual- 
quier i'(l < i < k)xÇ. E Al si y sólo si (T - Xil)(jt) = 0. Por lo tanto para 
cualquier x Ç Ea, 

q(J)(x) = (T - X.l) (T — X,l) ... (T — \ k \)(x) - 0. (9) 

Como T es diagonalizable, V = E,. © E,, ® • • • © E At por el Teorema 
5.14. Así, de la ecuación (9), q( T)(x) = 0 para toda x ÇV y por lo 
tanto q( T) = T 0 . 

Recíprocamente, supóngase que existen escalares X,, X„ . . . , \ k (nece- 
sariamente eigenvalores de T) tales que el polinomio mínimo, v(t), para 
T se factoriza en \ 

p(t) - (t- \,)(t - X,) ... (t - X,.). 

Si k = 1, entonces (T — x,l)(*) —0 para toda xÇ\J. Por lo tanto T = x.l, 
que es claramente diagonalizable. Supóngase entonces que k > 1. Sean 
{PíiO' i — 1, 2, . . . , k) los polinomios de Lagrange asociados con X,, 
X,, . . . , Xfc (tal como se definieron en la Sección 1.6). La fórmula de 
interpolación de Lagrange muestra que 

’Ï.PiU) = 1, 

j —1 

donde el lado izquierdo de la igualdad es el polinomio constante 1. Por 
lo tanto 

Ìj/ b (T) (•*) = I(jt) —x (10) 

} 

para toda x Ç V. Además, la definición de poiinomio de Lagrange mues- 
tra que (/ — X,)p,(r) = cp(t) donde c es un escalar. Por lo tanto 

(T - X;l)p f (T) (jr) = cp(J) (x) =cJ„(x) = 0, 

de modo que Pj(T) (x) £ Ej,. Entonces por la ecuación (10) 

V = E,\, + Ea 3 + ... -|- E,\,., 

y así V está generado por su conjunto de eigenvectores. Por lo tanto V 
tiene una base de eigenvectores (Ejercicio 11 de Ia Sección 1.6), y en- 
tonces T, de acuerdo con el Teorema 5.4, es diagonalizable. ■ 

Ejemplo 32. Determinaremos todas las matrices A ÇM,„(/?) para Ias 
cuales A- — 3A 4- 2/ = O donde O es Ia matriz nula de 2 x 2. Defínase 
g(t) = t- — 3/ + 2 = (t — ])(t — 2). Como g(A) = O, el polinomio 
mínimo p(t) para A divide a g(t). Por lo tanto los únicos candidatos 
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posibles para p(t) son t — I, / — 2 o (/ — 1)(/ — 2). Nótese que en 
cualquiera de estos casos A es diagonalizable en virtud del Teorema 5.33. 
Si /;(/) — t - 1 o p(t) — t — 2, entonces A — l o A = 2/. Si p(t) = 

- (t - 2), entonces A es similar a 

(ò °)* 

Ejemplo 33. Demostraremos que si A es una matriz real de n x n tal 
que A : ' — A , entonces A es diagonalizable. Nótese que si g(t) = — / — 

= /(/ + 1)(* - 1), entonces g(A) —O donde O es la matriz nula de 
n x n. Por lo tanto el polinomio mínimo p(t) para A divide a g(t). Como 
g(t) no tiene factores repetidos, tampoco los tiene p(t). Luego, de acuer- 
do con el Teorema 5.33, A es diagonalizable. 

Ejemplo 34. En el Ejemplo 31 vimos que el polinomio mínimb para el 
operador de diferenciación D: P,(R) P.(R) cs /\ Por tanto D no es 

diagonizable (Teorema 5.33). 

EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Suponer en lo 
que sigue que todos los espacios vectoriales son dimensionalmente finitos. 

(a) Todo opcrador lineal T tiene un polinomio p(t) de grado máximo 
para el cual /;(T) = T„. 

(b) Todo operador lineal tiene un polinomio mínimo único. 

(c) E1 polinomio característico de un operador lineal divide al poîinomio 
mínimo para ese operador. 

(d) Los polinomios mínimo y característico de cualquicr opcrador diago- 
nalizable son idénticos. 

(e) Sean T un operador lineal en un espacio vectorial n-dimensionaî V, 
p(t) el polinomio mínimo para T, y /(/) cî polinomio característico 
de T. Si /(/) se descompone en un producto de factores de grado L 
entonces /(/) divide a [p(t)Y'. 

(f) El polinomio mínimo para un opcrador lincal siempre ticne el mismo 
grado que el polinomio característico del operador. 

(g) Un operador lineal es diagonalizable si su polinomio mínimo se des- 
compone en un producto de factores de grado 1. 

(h) Sea T un operador lineal en V. Si V es un subespacio T-cíclico, enton- 
ces el grado del polinomio mínimo para T es igual a dim(V). 

2. Calcular el polinomio mínimo para las siguientes matrices. 
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3. Calcular el polinomio mínimo para cada uno de los siguientes operadores 
lineales. 

(a) T: P,(R) -> P,(«), donde T(/) =/'4 2/ 

(b) T: R- R', donde T (a, b) = (a + a — b) 

(c) T: AA nvll (/? ) ■—> AA, IVIl (/?), donde T (A) — A'. Sugerencia: Nótese 

que T- — I. 


4. Determinar cuáles de las matrices y operadores de los Ejercicios 2 y 3 son 
diagonalizables. 

5. Describir todos los operadores lineales T en R- tales que T sea diagonali- 
zable y T ; - 2T- 4- T — T„. 

6. Demostrar el Teorema 5.30 y su corolario. i 

7. Demostrar el corolario del Teorema 5.31. 

8. Sea T un operador lineal en un espacio vectorial dimensionalmente finito. 
Demostrar que si g(t) es el polinomio mínimo de T, entonces 

(a) T es invertible si y sólo si #(0) 0. 

(b) Si T es invertible y g(t) — t" 4 a„ 1 4 ... 4- aj 4- a». entonces 

T 1 = - (—T“ ' 4 —- T" + ... + i^l). 

V a» a» a» ) 

9 . Sea T un operador lineal diagonalizabìe en un espacio vectorial dimensional- 
mente linito V. Demostrar que V es un subespacio T-cíclico si y sólo si cada 
uno de los eigcnespacios dc T es unidiniensiona!. 

10. Sea ,c(/) el polinomio auxiliar de una ecuación diferenciaì lincal homogénea 
con coeficientes constantes (tal como se definió en ïa Sección 2.7), y sea V 
e! espacio dc soluciones de la ecuación diferencial. Demostrar que 

(a) V es un subespacio D-invariante, donde D: es el operador 

de diferenciación. 

(b) E1 polinomio mínimo para D v (la restricción de D a V) es g(t). 

(c) Si el grado de g(t) es //, entonces el polinomio característico de 
D: V->V es (-1 )"#(/). 

Sngeremïa: Para (b) y (c), utilizar el Teorema 2.36. 

11. Sea D: P (R) —> P(R) el operador de diferenciación en el espacio de todos 

!os polinomios sobre R. Demostrar que no existe ningún polinomio g(t) 
para el que #(D) — T (p . Por lo tanto D: P( R ) P( R ) no tiene polinomio 
mínimo. 
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12. Sea V un espacio vectorial dimensionalmente finito y sea T un operador ii- 
neal en V. Supóngase que W, y W, son subespacios T-invariantes de V 
tales que V Wj ® W, y sean p,(t) y pAO los polinomios mínimos para 
T W| y T Wa , las restricciones de T a W, y W., respectivamente. Demostrar 
positiva o negativamente que Px(t)pAt) es el poiinomio mínimo para T. 

13. * Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 

y sea W, un subespacio T-invariante de V. Si ar£V y .v^W,, demostrar lo 
siguiente: 

(a) Existe un polinomio mónico único g,(/) de grado positivo mínimo 
tal que £,(T)(jr) ÇW,. 

(b) Si h(t) es un polinomio para el cual //(T)(.r)(W„ entonces ,v,(/) 

divide a //(/). I 

(c) Sea W, un subespacio T-invariante de V tal que W, C W,. Demostrar 
quc si g-j(t) es el único polinomio mónico de grado positivo mínimo 
tal que íf-j(T) (.v) ÇWo, entonces #,(/) divide a gj(/). Deducir que 
#,(/) divide a los polinomios mínimo y característico de T. 

Definición. Sea T: V —> V //// operador lineal en un espacio vectorial dimen - 
sionalniente finito V. Para cada x nula en V el T-aniqnilador de x r.v 
el polinoniio niónico p x (t) de nienor grado positivo para el que p x (T)(x) 

0. Ohsérvese que por el Ejercicio ld(a) anterior (con W, (()}) cnal- 
qnier x no nnla en V Z/V/zc //// T-aniqnilador nnico . 

14. * Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 

y sea .v un elemento de V no nulo. 

(a) Mostrar que si q(t) es un polinomio cualquiera tal que ,e(T)(.v) (/. 

entonces //,(/), el T-aniquilador de jv, divide a q(t). 

(b) Sea W C, el subespacio T-cíclico de V generado por v. Demostrar 
que el polinomio mínimo para T w es //,(/) y por lo tanto la dimen- 
sión de C, es igual, por el Teorema 5.32, al grado del T-aniquilador 
de x. 

(c) Demostrar que pAO cs de grado I si y sóio si .v es un eigenvector 
de T. 
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Formas canónicas 


Vimos en el Capítulo 5 que para un operador lineal T en un espacio vec- 
torial dimensionalmente finito V, es benéfico descomponer a V en una 
suma directa de tantos subespacios T-invariantes propios como sea posible. 
E1 Ejercicio 7 de la Sección 5.4 muestra que V puede descomponerse en 
una suma directa de subespacios T-invariantes unidimensionales si^y sólo 
si T es diagonalizable. En este capítulo estudiaremos especialmente la des- 
composición de V en subespacios T-invariantes propios cuando T no sea dia- 
gonalizable. Las Secciones 6.1 y 6.2 están destinadas al estudio de los 
operadores cuyos polinomios característicos se descomponen en un pro- 
ducto de factores de grado 1 y la Sección 6.3 está dedicada a los opera- 
dores lineales cuyos polinomios característicos no pueden factorizarse de 
esta manera. Estas descomposiciones conducirán a representaciones sen- 
cillas (canónicas) de tales operadores. 


6.1 EIGENVECTORES GENERAUZADOS 


En las primeras dos secciones de este capítulo consideraremos operadores 
lineales en espacios vectoriales dimensionalmente finitos para los que el 
polinomio característico se descompone en un producto de factores de 
grado 1. (En particular, si V es un espacio vectorial dimensionalmente fi- 
nito sobre un campo algebraicamente cerrado, todo operador lineal en V 
satisface esta condición.) Tales operadores tienen al menos un eigenvalor. 
Si Ai, À,, . . , À n son los eigenvalores de T: V —> V (no necesariamente 
diferentes), recuérdese del Teorema 5.4 que T es diagonalizable si y 
sólo si existe una base ordenada para V que esté formada por eigenvectores 
de T. Si t /3 = {x u Xj, . . . , x n ) es dicha base en la cual x f es un eigenvec- 
tor correspondiente al eigenvalor Aentonces 


m. 


Mi o 
0 A 2 


l\ 


XJ 


\0 


0 
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Aun cuando no todo operador lineal T en V es diagonalizable, demos- 
traremos que para cualquier operador lineal cuyo polinomio característico 
se descomponga en un producto de factores de grado 1 existe una base 
ordenada p para V tal que 


íò 


[T•••©■/* = 


O 

Ji 


°o\ 


\0 O • • • J k l 


donde / ? es una matriz cuadrada de la forma (A ? ) o bien de la forma 
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0 
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0 0 ••• 

0 
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para algún eigenvalor \ } 

de ‘ 

r. A tal matriz J t 

se 

le llamará un 

bloque de 

Jordan correspondiente a 

i \j 

y la matriz 

m. 


h © Ji © * * * 

®J k será 


denominada forma canónica de Jordan de T. Diremos también que la base 
ordenada /3 es una base canónica de Jordan para T. Obsérvese que cada 
bloque de Jordan J v es “casi” una matriz diagonal —de hecho, [T]^ es 
una matriz diagonal si y sólo si cada / t es de la forma ( \ } ). 

Por ejemplo, la matriz de 8 x 8 


J — J\ ® Ji® Jì ® J A 
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0 

0 

0 

0 
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0 
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0 

0 
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0 

0 

0 

0 

0 

0 

0 

2 

0 

0 

0 

0 

0 

0 

0 

T 

T" 

T 

0 

0 

0 

0 

0 

0 

0 

3 

0 

0 

0 

0 

0 

0 

’ò"" 

0 

0 

1 

'0 

0 

0 

0 

0 

0 

0 

0/ 


es una forma canónica de Jordan de un operador lineal T: C s -> C 8 ; esto 
es, existe una base J3 = [x ly x 2 , . . . , x H } para C 8 tal que [T]^ = /. Nótese 
que el polinomio característico de T y / es det(/ — //) = (/ — 2) 4 (t — 
~3)“/“ y así la multiplicidad de cada eigenvalor es el número de veces 
que el eigenvalor aparece en la diagonal de /. Obsérvese también que de 
los vectores x l9 x 2 , . . . , x H únicamente x u x u x- 0 y x : (los vectores de la 
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base correspondientes a la primera columna de cada uno de los bloques 
de Jordan J u J 2 , J 3 y J t ) son eigenvectores de T. 

Aunque se demostrará que todo operador cuyo polinomio caracterís- 
tico se descompone en un producto de factores de grado 1 tiene una 
forma canónica de Jordan única (de acuerdo con el orden de los bloques 
de Jordan), no significa que la forma canónica de Jordan queda comple- 
tamente determinada por el polinomio característico de la transformación. 
Por ejemplo, el polinomio característico de 

2 1 
0 2 
cTo 
0 0 
0 0 
0 0 
0 0 
0 0 

es también (/ — 2)*(t — 3) 2 P. 

Considérese de nuevo a la matriz anterior J. Hemos visto que x, y x, 
son eigenvectores correspondientes al eigenvalor A t = 2, pero ni x 2 ni 
x 3 son eigenvectores. Por lo tanto (T - 21) (jc u ) = (T - 21) (x 4 ) = 0, 
mientras que (T - 21) (jc 2 ) ^Oy (T — 2\)(x 3 )^0. Pero como [T] p = J, 
T(x 2 ) = x 3 + 2x 2 y T(* 3 ) = x 2 + 2x 3 . Entonces 

(T - 2I) 2 (* 2 ) = (T - 2I)(T(jc 2 ) - 2x 2 ) = (T - 21) (x t ) = 0, 
y, de manera semejante, 

(T - 2I) 3 (* 3 ) = (T - 2l) 2 (T(jr 3 ) - 2* 3 ) = (T — 2I) 2 (jc 2 ) = 0. 

Luego, aun cuando (T - 2\)(x 2 ) ^LO y (T — 21) (jc 3 ) ^ 0, (T - 2\)*(x 2 ) 
~ (T — 21 ) p (-c 3 ) = 0 si p > 2. Esta observación da lugar a la siguiente 
definición. 

Defin ición. Sea T un operador ìineal en un espacio vectorial dimensionalmente 
finito V. Un elemento no nulo x£V re llama eigenvector generalizado de T 
si existe un escalar X tal que (T — Àl) p (x) = 0 para algún entero positivo 
p. Diremos que x es un eigenvector generalizado correspondiente a X. 

Obsérvese que si x es un eigenvector generalizado de T correspondien- 
te a X, entonces X es un eigenvalor de T. Ahora si p es el menor entero 
positivo tal que (T — Al)»'(x) = 0, entonces y = (T — Al) p - 1 (j<:) es un 
eigenvector de T correspondiente al eigenvalor A. 

Se ve fácilmente que si [S es una base canónica de Jordan para un 
operador T en un espacio vectorial dimensionalmente finito V, entonces 
p está formada de eigenvectores generalizados de T. E1 Teorema 6.4 mos- 
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trará' que una base canónica de Jordan existe para todo operador V cuyo 
poîinomio característico se descompone en un producto de factores de 
grado 1. La demostración de este teorema requerirá de terminología adi- 
cional que introduciremos a continuación. 

Definiciones. Sea T un operador Iineal en un espacio vecîorial V y sea x un 
eigenvecîor generalizado de T correspondieníe al eigenvalor \. Si p es el 
eníero posiîivo más pequeno tal que (T — Al) p (x) = 0, entonces eî con - 
jimîo ordenado 

{(T - Àl)'>-’(x), (T - Àl)»- 2 (x), . .. , (T - Àl)(x), x}, 

sc Ilama un ciclo de eigenvecíores generalizados de T que corrgsponden a 
A. Los elementos (T — \\)^(x) y x se llaman vector inicial y vector ter- 
minal del ciclo, respectivamente. Diremos también que îa longitud del 
ciclo es p. 

Recoriando la matriz J de la p. 322 vemos que j3 A = {x u Xj, xj, /3-> = 
= {jc 4 }, /L = {xr ì9 t í; ) y /? 4 = {x 7 , x s ) son ciclos de eigenvectores gene- 
ralizadcs de T correspondientes respectivamente a los eigenvalores 2, 2, 
3 y 0. Sea W ; el subespacio generado por j3- t para 1 < i < 4. Como 
T (jt, ) = 2jCt, T(jCj) = X\ + 2x 2 y J(x-,) = x> + 2x„ W, es un subespacio 
T-invariante. De la misma manera W 2 , W ;< y W 4 son subespacios T-inva- 
riantes. Se ve fácilmente que [T W( ] A = J t (1 < i < 4). 

Nuestro primer resultado contiene varios resultados útiles sobre ciclos. 

Teorema 6.1. Sea T un operador lineal en V y sea y un ciclo de eigenvectores 
generalizados de T que corresponden al eigenvalor A. 

(a) El vector inicial de y es un eigenvector de T correspondiente al 
eigenvalor \ y ningún otro miembro de y es un eigenvector de T. 

(b) y es lineaîmenie independiente. 

(c) Sea /3 una base ordenada para V. Entonces /3 es una base canc>- 
nica de Jordan para V si y sólo si (3 es una unión disjunta de 
ciclos de eigenvectores generalizados de T. 

demostración. Demostraremos únicamente a (b); las demostraciones 
para (a) y (c) se dejarán como ejercicios. La demostración se hará me- 
diante inducción sobre la longitud del ciclo y. Si y tiene longitud 1, enton- 
ces y = {jc,} es linealmente independiente puesto que jc,, que es un eigen- 
vector generalizado, es un vector no nulo. Ahora supóngase que los ciclos 
de longitud k — 1 son linealmente independientes para algún entero k — 
— 1 > 1. Supóngase que y = {x,, x 2 , . . . , x k } es un ciclo de eigenvectores 
generalizados que corresponden al eigenvalor A y que 

2 a,x t = 0 


i ~ 1 
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para algunos escalares a u a ,, . . . , a k . Aplicando T — Al a la ecuación an- 
terior nos da 

k 

2 aix ,-, - 0 . 

i 2 

Pero la suma en la igualdad anterior es una combinación lineal de elemen- 
tos de un ciclo {x u x 2y . . . , x^) de longitud k — 1. Por lo tanto a t = 3 
para / — 2, 3, . .. , k, por lo que 

k 

2 ciiXi = 0 

i - 1 

se reduce a a x x y = 0. Pero como Jtj ^ 0 se tiene que = 0, Vîe manera 
que a A — a, ~ ... — a k = 0, demostrando que y es linealmentjé indepen- 
diente. Esto completa la inducción. ■ 

Recuéruese que si T es un operador lineal diagonalizable en V, enton- 
ces V es la suma directa de los eigenespacios de T (Teorema 5.14). Uno 
de los principales resultados de esta sección (Teorema 6.5) demostrará 
que si T es un operador lineal cualquiera en V cuyo polinomio característi- 
co se descompone en un producto de factores de grado 1, entonces V es 
la suma directa de los “eigenespacios generalizados” de T (los que se 
definen en seguida). Por lo tanto, como los eigenespacios de un operador 
diagonalizable proporcionaron una base para V formada por eigenvecto- 
res, los eigenespacios generalizados de un operador darán una base canóni- 
ca de Jordan para V. 

Definición. Sea X un eigenvaior de un operador lineal T en V. El eigenespacio 
generalizado de T correspondieníe a X y denoiado por Ka es el conjunîo 

K a = {x g V: (T — Al v ) p (x) — 0 para algún entero positivo p}. 

Luego, consta del vector nulo y de todos los eigenvectores generaîizados 

correspondientes a X. 

Nuestro siguiente teorema contiene dos hechos simples sobre los eigen- 
espacios generalizados. 

Teorema 6.2. Sea X un eigenvalor de un operador lineal T en V. Entonces Kx 
es un subespacio de V que contiene a Ea (ei eigenespacio de T correspondien - 
te a X). 

demostración. Es evidente que 0 £Ka. Supóngase que x, y £ K\; entonces 
existen enteros positivos p y q tales que (T — X\) n (x) = 0 y (T - X\) q (y) 
— 0. Ahora bien 

(T - Àl ) /m/ (jc -f y) (T -- X\) ì,+q (x) -f (T - Àl) /,+f/ (y) 

= (T ~ Àl)"(T ~ M) r ’(x) + (T - X\) r (J - Àl ) q (y) 
= (T - Àl ) q (0) 4- (T - Àl Y(0) 

= 0 + 0 = 0, 
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y entonces x + y Ç Ka. Finalmente, para cualquier escalar c, 


(T — AI) p (cjc) = c(T — \\) v (x) = cO = 0, 


tal que cx £ Ka. Por lo tanto Ka es un subespacio de V. 

Es evidente que Ea = N(T — Al) Ç Kx. ■ 

Veremos en el Teorema 6.5 que K\ es de hecho un subespacio T-inva- 
riante y que V es la suma directa de los eigenespacios generalizados de T. 
E1 teorema siguiente demuestra parte de un resultado posterior. 

Teorema 6.3. Sean \ l9 A 2 , . . . , A* los distintos eigenvalores de un operador //- 
neal T en V. Entonces 1 

Kaj n (2 K Xj ) = {0} para i = 1, 2,. . .,k. 

j -i 

demostración. Por conveniencia de notación consideraremos sin pérdi- 
da de generalidad que / = 1. Supóngase que 


a 2 x 2 + . .. + a k x k = JCi ( 1) 

donde Xj Ç.K kj para 1 </<£:. Sea pj(l < / < A) el entero positivo más 
peqi/eno tal que (T — A/I) p '(jc/) = 0. Supóngase que JCx^fl; entonces 
(T — AiO^Cxi) es un eigenvector correspondiente al eigenvalor Ai. Apli- 
cando (T — AJJ^-^T — A 2 l) p2 ... (T — AaI) p * a ambos lados de la ecua- 
ción (1) se tiene 


0 = (T - AJ^-HT - A 2 I) P2 . . . (T - \ k \y>( Xl ) 

= (T - A 2 I) p = . . . (T - Afcl) p *((T - AxO^UO) 

= (\i - A 2 ) P2 . . . (A, - A fc ) Pk (T - AJÍ^Ui) 

en virtud del Ejercicio 22 de la Sección 5.1. Por lo tanto dado que 
Ai, A 2 , . .. , A* son distintos, (T ~ Ail) ft " 1 (jCi) = (?, contradiciendo el que 
(T — A 1 l) ftrl (xi) sea un eigenvector. Concluimos que jc^ = 0. ■ 

Coro/ar/o. Ningún vector puede ser un eigenvector generalizado correspondien - 
te a eigenvalores diferentes del mismo operador. 

Estamos ahora preparados para demostrar la existencia de una forma 
canónica de Jordan para cada operador lineal en un espacio vectorial dimen- 
sionalmente-finito cuyo polinomio característico se descomponga en un 
producto de factores de grado 1. 

Lema . Sea T un operador lineal en un espacio vectorial dimensionalmente finito 
V. Sea Si(l < i < k) un ciclo de eigenvectores generalizados de T corres - 
pondientes al eigenvalor \ y sean y y x la longitud y el vector inicial de 
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S u respeciivamente. Si {y u y 2 , . . . , y u } es* un conjunto linealmente indepen - 
diente que contiene k elementos, entonces 

Ù Si 

i=l 

es conjunto linealmente independiente que contiene 

k 

.2 Pi 

i =1 

elementos. 

demostración. Supóngase sin pérdida de generalidad que Pi > p 2 > ... 
... > p/f. La demostración se hará por inducción sobre p u Si p x =f 1, en- 
tonces Pi = ... — Pk — 1. Por lo tanto, cada ciclo S * contiene mn solo 
elemento, de modo que 

k 

U s ‘ = {^1.^2, • • • ,yk} 

es un conjunto linealmente independiente que por hipótesis contiene 

2 Pi = k 

i =1 

elementos. 

Ahora supóngase que el teorema es cierto siempre que p x < n y sea 
*Si (1 < i < k) un ciclo de eigenvectores generalizados de T correspon- 
dientes al eigenvalor A. con longitud Pi y vector inicial y^. Supóngase que 
n — Pi> Pz> ... > Pk y sea r(l < r < k) el subíndice más grande tal 
que p r > 1. Sea 

5 =y 

y sea S'. (1 < i < r ) el ciclo obtenido al suprimir el vector terminal 
de Si. Entonces 5' es un ciclo de eigenvectores generalizados que corres- 
ponden al eigenvalor À con longitud p^ — 1 y vector inicial y^. Como 
[y l9 . .. , y r ) es linealmente independiente, se tiene por la hipótesis de 
inducción que 

s’ - ú s: 

/=i 

es un conjunto linealmente independiente que contiene 

2 (Pi - 1 ) 

i = 1 

elementos. Es evidente que 

U S { — S U {*!,..., 
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es una unión disjunta. Entonces 

LJ5, 

(-1 


contiene 

i (Pt - 1) + k = 2 (Pt - 1) + *= kpi 

i _ l i — l i = i 

elementos. 

Necesitamos demostrar únicamente que 

^ = U s, \ 

t= ì / 

es un conjunto linealmente independiente. Supóngase que para algunos 
escalares a z 

2 V = 0. (2) 

zes 

Como, de acuerdo con el Teorema 6.1(a), y, es un eigenvector de T 
correspondiente al eigenvalor X, (T — XI)(y 4 ) = 0 para 1 < i < k. Por lo 
tanto, al aplicar T — XI a ambos lados de la ecuación (2), obtenemos 

0 = £ a,(T - Al)(z) = 2 aX T - X\ )(z), (3) 

zez 

donde Z — {v£5: v^y\ para 1 < i < &}. Pero la suma final en la ecua- 
ción (3) es una combinación lineal de elementos de S'\ luego como 5' 
es linealmente independiente, se tiene que a z = 0 si z £ Z. Luego la ecua- 
ción (2) se reduce a una combinación lineal de {y x , y 2 , . . . , y*}, la cual 
es, por hipótesis, linealmente independiente. Por lo tanto, todos los coefi- 
cientes a z de la ecuación (2) son iguales a cero, demostrando que S es 
linealmente independiente. ■ 

Ejemplo 1. Sea T: C 11 -► C 11 un operador lineal cuyo polinomio caracte- 
rístico se descompone en un producto de factores de grado 1. Este ejemplo 
y el Ejercicio 8 ilustran la manera cómo una base oanónica de Jordan y 
para la restricción de T a R(T) se extiende a una base canónica de Jor- 
dan p para T en el Caso 1 del Teorema 6.4. Supóngase que y = {y u w u 
y 2 , v,, v,} y que 


(° 

1 

0 

0 

0 

°\ 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

V 

2 

1 

0 

0 

0 

0 

0 

2 

0 

\o 

0 

0 

0 

o" 

~3/ 
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donde L denota la restricción de T a R(T). Entonces {y t , vv,}, {y>} y {v,, 
v,} y {v ;{ }, que son los ciclos que componen a y, corresponden respectiva- 
mente a los eigenvalores 0, 0, 2 y 3. En la notación del Teorema 6.4, y 0 , 
la unión de los ciclos correspondientes a 0, es igual a {y u vv t } U {y,}. 
Entonces Y = {y H y>} (el conjunto que contiene a los eigenvectores con- 
tenidos en y que corresponden a cero) es un subconjunto linealmente 
independiente de N(T) que puede ser extendido a una base Y U Z = {y u 
y,, Zu z-a) para N(T). Finalmente, escójase a^y x, tales que T(x0 = 
- vv, y T(x.) = y 2 . Entonces {y„ vv„ x,}, {y 2 , x,}, {zj, {z a } y {Zs} son 
ciclos de eigenvectores generalizados de T correspondient.es al eigenvalor 
cero y /3 = {y,, vv„ jc„ y 2 , x 2 , v,, v 2 , v ;! , z l5 z 2 , z 3 } es unalbase ordenada 
para C 11 . Obsérvese que / 


'0 

1 

0 

0 

0 

0 

0 

0 

0 

0 

°\ 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

2 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

2 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

"o’ 

T 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

'0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

T 

T 

0 

lO 

0 

0 

0 

0 

0 

0 

0 

0 

T 

’ój 


Teorema 6.4. Sea T un operador ìinecd en un espacio vectorial n-dimensional V 
ta/ e/ polinomio característico de T descompone en un producto de 
factores de grado 1. Entonces existe una base canónica de Jordan para T; 
esto es , existe una base ordenada /3 para V que es una unión disjunta de 
ciclos de eigenvectores generalizados de T. 

demostración. La demostración se realizará por inducción sobre n. 
Es evidente que el resultado es cierto para n = 1 pues toda matriz de 
1 X 1 es una forma canónica de Jordan. Supóngase que la conclusión 
es cierta para espacios vectoriales de dimensiones menores que n y que 
dim(V) = n. Consideraremos dos casos. 


Caso 1. rango(T) < n. Puesto que R(T) es un subespacio T-invariante 
de V podemos definir a T,: R(T) R(T) como la restricción de T a R(T). 
La suposición del Caso 1 nos permite utilizar la hipótesis de inducción a 
Tj para concluir que existe una base canónica de Jordan y para L que 
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contiene r elementos (r < n). Por lo tanto, en virtud del Teorema 6.1(c), 
y es una unión disjunta de ciclos de eigenvectores generalizados de L (y 
por tanto de T). Sean S u S 2 , . .. , S k todos aquellos ciclos en y que corres- 
ponden al eigenvalor cero, y sean y Wi respectivamente los vectores 
inicial y terminal de S h Como vViÇyÇR(T), existe jc* ÇV tal que 
T (*i) i= Wi. Ahora defínase Y •= {y l9 y 2 , . .. , y*}, X = {jr„ jc 2 , . .. , jc*} 

y 

7o = y s t . 

Supóngase que y 0 contiene p elementos (p < r). Recuérdese 
6.1 (a) que cada y-, es un eigenvector que corresponde al eigenvalor cero; 
por tanto Y Ç N(T). Luego, como Y es linealmente indepvendiente (es un 
subconjunto de y), puede ser extendido hasta una base Y U Z para N(T). 
Obsérvese que Z debe contener n — r — k elementos puesto que nuli- 
dad(T) = n — rango(T) = n — r. Sea 5' = Si U {jcì}; entonces 5' es 
un ciclo de eigenvectores generalizados de T que corresponden al eigen- 
valor cero y que tiene como vector inicial a y». Además, si z €Z, entonces 
{z} es un ciclo correspondiente al eigenvalor cero cuya longitud es 1. 
Por lo tanto el lema implica que 

(Ò Si)uZ = (y 0 UX)UZ 

es un conjunto linealmente independiente que contiene p ~r k + (n ~ r — 
— k) — n — (r ~ p) elementos por el hecho de ser Y U Z un conjunto 
linealmente independiente de vectores iniciales para los ciclos que corres- 
ponden al eigenvalor cero. 

Demostraremos que ^ = yUZUZes!a base que se desea encontrar. 
Primero, obsérvese que si y 0 = y (de manera que p = r), entonces /3 = 
= yo U X U Z es un conjunto linealmente independiente que contiene 
n — (r ~ p) — n elementos. Entonces /3 es una base para V. De Io con- 
trario, si 70 = 7 ^ 7 , entonces y^ = {vÇy: v 0 y o } es una unión no vacía de 
ciclos disjuntos de eigenvectores generalizados que corresponden a eigen- 
valores no nulos X 2 , . . . , À™ de T. Supóngase que 



Entonces 


0 = j:a v v= 2 

v&fi vSyoUXuZ 


a v v + 2J a v v. 

veyi 


2 (~a v )v 

vGypUXuZ 


5 J a v v. 

v€y i 


Pero el lado izquierdo es un elemento de Kx„ donde A, = 0 y el lado 
derecho es un elemento de Kx, + . . . + K*„. Por lo tanto de acuerdo 
con el Teorema 6.3, ambos lados de la igualdad anterior son iguales a 0. 
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Así, como y 0 U X U Z y y^ son conjuntos linealmente independientes, se 
tiene que a v = 0 para toda vÇjS. Por lo tanto /3 es linealmente indepen- 
diente, y como /3 = y U X U Z contiene r + k + (n - r - k) = n ele- 
mentos, f3 es una base para V. Pero es evidente que /3 es una unión disjunta 
de ciclos de eigenvectores generalizados de T, de modo que /3 es una base 
canónica de Jordan para T por el Teorema 6.1. 

Caso 2. rango(T) = n. Como el polinomio característico de T se des- 
compone oomo un producto de factores de grado 1, T tiene un eigenvalor 
A. Utilícese el Caso 1 para el operador no invertible T -\j en V para 
obtener una base ordenada /3 para V tal que [T — Al]p = J seg una forma 
canónica de Jordan para T — Al. Pero entonces [T]p = / + A/ n es una for- 
ma canónica de Jordan para T. | 

Habiendo establecido la existencia de una forma canónica de Jordan, 
ya podemos obtener varias propiedades importantes de los eigenespacios 
generalizados. 

Teorema 6.5. Sea T un operador lineal en un espacio vectorial dimensionalmen - 
te finito V tal que el polinontio característico de T se descomponga en un 
producto de factores de grado 1. Supóngase que \ u A 2 , . . . , A* son los 
distintos eigenvalores de T y que ia multiplicidad de A, es m^ (1 < i < k) 
y sea /3 una base canónica de Jordan para T. Defínase a /3 t = /3 D K \ t (1 < 
< i < k). Entonces 

(a) V = K,©K,®...®K v 

(b) /3i es una base para K\ r Recîprocamente, si para cada i Ai es 
una unión de ciclos de eigenvectores generalizados correspondien - 
tes a Ai que constituye urta base para Kx,, entonces 

ỳ* 

es una base canónica de Jordan para T. 

(c) Ka, (1 < i < k) es un subespacio J-invariante de V. 

(d) Para cada i(l < i < k), dim( Kx,) = nii. 

(e) Para cada i(l < i < k), Kx, = N((T — X 1 l) n ' 1 )- 

(f) T es diagonalizable si y sólo si E\, = Kx, para cada i(l < i < 
<k). 

DEMOSTRACIÓN. 

(a) Es evidente que L(/?i) ç Kx,. Pero como 



se tiene que Kx, + Ka, + . .. + Kx, = V. E1 inciso (a) ahora puede de- 
ducirse a partir de! Teorema 6.3. 
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(b) Defínase a Wj como el subespacio generado por /?* para 1 < 
< i < k. Entonces W 4 C Ka ( , y por lo tanto dim(Wi) < dim(KxJ. Pero 
como fi es la unión disjunta de p í9 p 2 , . . . , y L(/0 « V, se tiene que 
V = Wj © W 2 © • • • © W*. Luego del inciso (a) tenemos que 

dim(V) = 2 dim(Wi) < 2 dim(Kx t ) — dim(V). 

i p 1 i = 1 

Por tanto dim(WO = dim(KA t ) para 1 < i < k. Dado que W> C Ka ( y 
dim(Wj) = dim(KAj), se tiene que L(/L) = Wi = KA t . Como fii es lineal- 
mente independiente (es un subconjunto de fi) 9 /3 L es una base para K Ai . 

La recíproca se obtiene del inciso (a) y de los Teoremàs 5.13 y 
6.1(c). 1 

(c) Recuérdese que Ka, es un subespacio de V (Teorema 6.2). Ahora 
bien, fii es una base para K Ai formada por ciclos de eigenvectores ge- 
neralizados que corresponden a Aj. Pero la imagen bajo T de cualquier 
vector en un ciclo es claramente una combinación lineal de vectores en 
dicho ciclo y en consecuencia es un elemento de K Ai . Luego T(/?,) c K Ài , 
demostrando así que Ka, es T-invariante. 

(d) Defínase a T|(l < i < k) como la restricción de T a Ka ( Enton- 
ces, de acuerdo con el inciso (b), A { = [TJ^ es una forma canónica de 
Jordan para T,- y [T]^ = A t ®A 2 © • • • © A k . Si n t = dim(K A( ), entonces 
el polinomio característico de T t es det(T ( - — tl„) = (2 t - — t) nt puesto que 
Ai — tl ni es una matriz triangular superior que tiene a Xi — t en cada 
posición diagonal. Si f(t) es el polinomio característico de T, entonces 

/(/) = det(/L - tl ni ) * det (A 2 - tl ni ) • . . . * det(A k - tl nk ) 

= (Ài - /) Wl (A 2 - /) n ’ . . . (Àfc - t) n K 

Por lo que la multiplicidad de Ài es n^; o sea, m t = rti = dim(KA, ). 

(e) Es evidente que N((T — A t l) mi ) ç= K A( . Supóngase que x e K A( . 
Entonces el ciclo S con un vector terminal x , de acuerdo con el Teore- 
ma 6.1, es un subconjunto de Ka é linealmente independiente. Como dim 
(K\.) = rtii, se tiene que la longitud de S no puede exceder a w,; esto es, 
(T — Xi\) p (x) = 0 para algún entero positivo p < mi. Por lo tanto 
*£N((T — Àil) w< ), demostrando así que K Xi C N((T — Àjl) w ‘). 

(f) Si E Ai = Ka ( para 1 < / < k, entonces, de acuerdo con el inci- 
so (a), 

E Ai © E A2 © • • • © = K Al © K Ai © • • • © K* = V 


y así, por el Teorema 5.14, T es diagonalizable. 

Recíprocamente, si T es diagonalizable entonces dim(EA ) ■= m t por 
el Teorema 5.14. Pero como Ea, es un subespacio de K\. y dim(K A ,) = 
= m t , por el inciso (d), se tiene que E A( = K\ t para 1 < / < k. 
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Ejemplo 2. Sea T: C 3 -^C 3 definida mediante T — L 4 , donde 

/3 1 -2\ 


A = -1 0 5. 

\-l -1 4/ 

Encontraremos una base para cada eigenespacio y cada eigenespacio gene- 
ralizado de T. 

E1 polinomio característico de T es 

f(t) = det (A — !/) = —(/— 3 )(t - 2) 2 . 

Por lo tanto Ai = 3 y À 2 = 2 son los eigenvalores de T con multiplicidades 
1 y 2, respectivamente. De acuerdo con el Teorema 6.5, K À1 tiene dimen- 
sión 1, Ka 2 tiene dimensión 2 y también Kx t = N(T — 31) y Kà 2 = N 
((T - 2I) 2 ). Ahora bien E Àl = N(T - 31) y E À2 = N(T - 21). Por lo 
tanto E À1 = K Àl . Como 



'° 

1 

A - 3/ = 

-i 

-3 


\-i 

-1 

y sólo si 

( 0 

1 


-i 

-3 


i-i 

-1 

de manera equivalente, 

si y 


—2\ / a 


es una solución del sistema 

( b - 2c = 0 

| —a — 3b + 5c = 0 
\—a — b | c = 0. 

Por el hecho de que el conjunto de soluciones del sistema anterior tenga a 

in» 

como base. 


es una base para E À 
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Análogamente, como 


si y sólo si 


1 -2 


-1 -1 


b e E x 


o, de manera equivalente, si y sólo si 


es una solución del sistema 

a + b — 2c — 0 
< —a — 2 b “h 5c = 0 
—a — b + 2c = 0. 

Una base para el conjunto de soluciones de este sistema, y por tanto para 
es 


Como 


(A — 2/) 2 = I —4 -2 


1 -1 


si y sólo si 


es una solución del sistema 

í 2a + b — c — 0 
4 a — 2b + 2c = 0 
(—2 a — b + c — 0. 

Una base para el conjunto de soluciones de este sistema, y por tanto para 
Ka 3 , es 
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Obsérvese que esta base es un ciclo de eigenvectores generalizados corres- 
pondientes a À 2 . Por lo tanto de acuerdo con el Teorema 6.5 (b) 






es una base para C 3 y 


/3 0 0\ 

\0 0 2 / 


es una forma canónica de Jordan para T. . 

Ejemplo 3. Sea T: P 2 (C) —> P 2 (C) definida mediante T(/) = —/ — /'. 
De nuevo encontraremos una base para cada eigenespacio y cada eigenes- 
pacio generalizado de T. Si fi = {1, jt, Jt 2 }, entonces p es una base orde- 
nada para P 2 (C) y 

(~ l ~ l °\ 

A= m,= 0 -1 -2. 

\ 0 0-1 / 

Por lo tanto el polinomio característico de T es f(t) = áct(A — tl) = — 
“(/4- l) 3 . Entonces À = —1 es el único eigenvalor de T y por lo tanto, 
de acuerdo con el Teorema 6.5, Kx = P 2 (C) y así cualquier base para 
P 2 (C), por ejemplo /3, es una base para Ka. Ahora bien, Ex = N(T — 
— Àl) — N(T -f I). Entonces si f(x) = a 4- bx + cx 2 £P 2 (C), se tendrá 
que f(x) Ç Ex si y sólo si 

0 = J (f(x )) 4 -f(x) 

= [— (a 4- bx 4- cx 2 ) — (b 4* 2cx)] 4- (a 4- bx 4- cjc 2 ) 

= ~(b 4- 2cjt). 


Pero ~(b 4- 2cjc) = 0 si y sólo si b = c = 0. Por lo tanto f(x) ÇEx si 
y sólo si f(x) = a para alguna aÇ_C y entonces {1} es una base para Ea. 

Como K\ = P 2 (C), deben existir ciclos de eigenvectores generalizados 
correspondientes a À que formen una base canónica de Jordan para T. 
De hecho, se tiene del Ejercicio 4 que un ciclo único (de longitud 3), y 
no la unión de dos ciclos (uno de longitud 2 y el otro de longitud 1) 
ni la unión de tres ciclos (todos de longitud 1), formará una base para 
P 2 (C). Tal ciclo es y = (2, —2jt, Jt 2 } y 

(~ l 1 

m r = o -i 

\ 0 0 

es una forma canónica de Jordan para T. Veremos en la sección siguiente 
cómo encontrar tal base canónica de Jordan. 
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EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Los eigenvectores de un operador lineal T son también eigenvectores 
generalizados de T. 

(b) Es posible que un eigenvector generalizado de un operador lineal T 
esté asociado con un escalar que no sea un eigenvalor de T. 

(c) Cualquier operador lineal en un espacio vectorial dimensionalmente 
finito tiene una forma canónica de Jordan. 

(d) Los ciclos de eigenvectores generalizados son linealmente indepen- 

dientes. \ 

(e) Existe exactamente un ciclo de eigenvectores generalizados corres- 
pondientes a cada eigenvalor de un operador lineal en un espacio 
vectorial dimensionalmente finito. 

(f) Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito cuyo polinomio característico se descompone en un producto 
de factores de grado 1, y sean A,, À L ., . . . , À* los distintos eigenvalo- 
res de T. Si, para cada i, /3-, es una base cualquiera para Ka ( , entonces 
(3\ U /L U ... U /3 ÌC es una base canónica de Jordan para T. 

(g) Para cualquier bloque de Jordan /, L; tiene una forma canónica de 
Jordan /. 

(h) Sea T un operador lineal en un espacio vectorial n-dimensional cuyo 
polinomio característico se descompone en un producto de factores 
de grado 1. Para cualquier eigenvalor À de T, Ka = N((T — Àl) n ). 

2. Para cada uno de Ios siguientes operadores lineales T, encontrar una base 

para cada eigenespacio y para cada eigenespacio generalizado. 

(a) T — L,, donde 



(b) T = L t , donde 



(c) T: P,(C) —> P-j(C) definido mediante T(/) — 2/ — /' 

3.* Sea S un ciclo de eigenvectores generalizados de un operador lineal T en 
V que corresponde al eigenvalor À. Demostrar que el subespacio generado 
por S es un subespacio T-invariante de V. 
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4. Sea p una base canónica de Jordan para un operador lineal T en V y sea 
[T]^ = Ji ®J 2 ® * * * ®Jk> donde cada J,(\ < i < k) es un bloque de 
Jordan. Sea À un eigenvalor de T y sea m el número de bloques de Jordan 
que tienen a À en cada una de las posiciones de la diagonal. Demostrar que 
\ < m < dim(Ex). Veremos más adelante que m — dim(E A ). 

5. Sea T: V —> W una transformación lineal. Demostrar los incisos siguientes: 

(a) N(T) - N(-T). 

(b) N(T fc ) — N(( — T) A ) para cualquier entero positivo k. 

(c) Si W = V (tal que T es un operador lineal en V) y À es un eigen- 
valor de T, entonces para cualquier entero positivo k 

N((J - Al v )*) = N(UI V - T)*). V 

6. Sea U un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demcstrar los siguientes incisos: 

(a) N(U) C N(U 2 ) Ç . . . Ç N(U*) Ç N(U fc+1 ) Ç . . .. 

(b) Si rango(U w ) - rango(U w+1 ) para algún entero positivo m, entonces 
rango(U W1 ) = rango(U*) para cualquier entero positivo k > m. 

(c) Si rango(U w ) — rango(U w+1 ) para algún entero positivo m, entonces 
N(U m ) = N(U fc ) para cualquier entero positivo k > m. 

(d) Sea T un operador lineal y sea À un eigenvalor de T. Demostrar que 
si rango((T - Àl) w ) ^ rango((T - Àl) m+1 ) para algún entero m, en- 
tcnces K a = N((T — Àl) m ). 

(e) Segunda prueba para diagonalizabilidad . Sea T un operador lineal 
cuyo polincmio característico se descompone en un producto de fac- 
tores de gradc 1. Supóngase que À M À 2 , ... , À A son los distintos 
eigenvalores de T. Entonces T es diagonalizable si y sólo si rango(T — 
- Àjl) = rango((T - À,l)-) para \ < i < k. 

(f) Utilizar el inciso (e) para obtener una demostración más sencilla del 
Ejercicio 10(d) de la Sección 5.4: Si T es un operador lineal diago- 
nalizable en un espacio vectorial dimensionalmente finito V y W es 
cualquier subespacio T-invariante de V, entonces T w es diagona- 
îizable. 

7. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal quc el polinomio característico /(/) de T se descompone en un producto 
de factores de grado î. Demostrar que /(T) = T«; esto es, demostrar que T 
satisface a su polinomio característico. (Este es un caso especial del Teo- 
rema de Cayley-Hamilton.) Sugerencia: Demostrar que si B es una base 
canónica de Jordan para T, entonces f(T)(x) — 0 para cada x£ft. 

8. Este ejeícicio tiene ccnio finalidad ilustrar la demostración del Caso 1 del 
Teorerna 6.4 para una transíorrnacion îineal particular T: C n > C n . (Ver 
también el Ejemplc 1.) 
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Sea T: C 11 —> C 11 definida mediante 

T(w) = (a 7 + 2 a-> — a 3 , —a 3 — Sa^ + 3 a 3 , — 2 a x — la 3 + 4a 3 , 

6 a 4 — 9 a 5 , 4a 4 — 6ck, a s + a 7 , —ae + 3a 7 , 3 a s , 0, 0, 0), 

donde u (a 7 , a 3 , a 3 , a 4 , a 3 , a s , a 7 , a^, a 3 , a 7 o, an). 

(a) Sea y = {y 4 , w„ y 2 , v„ v 2 , v 3 }, donde y 7 = e 7 - 2e> - 3e 3 , w 7 = 

~ — 3e 2 — 5e 3 , y 2 = 3e t + 2e s , v, = e 6 + e 7 , v 2 \= 3e e +4e 7 y 

v 3 = e 3 . Demostrar que y es una base ordenada para-RfT). Sugeren- 
cia: Tomando a u como en el párrafo anterior 

T(u) = (-«! + 4a 2 — 3a 3 )y 1 + (a 7 — a 2 + a 3 )w 7 + (2a t — 3 a 5 )y 2 

+ (7 a e — 5 a 7 )v t + ( — 2a« + 2a 7 )v 2 + (3a 8 )v 3 . 

(b) Dedúzcase que r, el rango de T, es igual a 6 y que la nulidad de 
T es 5. 

(c) Sea Ti la restricción de T a R(T). Demostrar que y es una base 
canónica de Jordan para T„ 

(d) Demostrar que S x = (y„ w,}, S 2 = {y 2 }, S 3 = {v„ v 2 } yS 4 = {v 3 } 
son ciclos de eigenvectores generalizados de T x correspondientes res- 
pectivamente a los eigenvalores 0, 0, 2 y 3. (Por lo cual, en la nota- 
ción de la demostración del Teorema 6.4, k = 2, y 0 = {y„ w u y 2 } y 
P=3.) 

(e) Sean j: x = — e t + 5e 2 + le 3 y x 2 = 8e t + 5e 5 . Demostrar que 

T(-t») = Wj para i = 1, 2. Hágase X = {*„ x 2 ). 

(f) Obsérvese que en la notación de la demostración del Teorema 6.4 

los vectores y 2 y w 2 son iguales, y hágase + = {y„ y 2 }. Defínanse 

Zi = e„, z 2 = e 10 y z 3 = e tl . Demuéstrese que Z = {z„ z 2 , z 3 ) es un 
conjunto (que contiene n — r — k elementos) tal que Y U Z es una 
base para N(T). 

(g) Defínanse S[ = {y„ w„ x,} y S[ = {w 2 , x 2 }. Demostrar que S[ y 
S[ son ciclos de eigenvectores generalizados de T correspondientes al 
eigenvalor cero. Entonces, de acuerdo con el lema del Teorema 6.4, 

(Û u Z = (y 0 UX)U Z 

es un conjunto linealmente independiente que contiene a n — (r — 
— p) = 8 elementos. 

(h) La demostración del Teorema 6.4 muestra que /? = y U AT U Z es 
un conjunto linealmente independiente. Considerando este hecho de- 
dúzcase que P es una base para C". 

(i) Finalmente, demostrar que /3 es una base canónica de Jordan para T 
mediante el cálculo de [T]^. 


9. Demostrar los incisos (a) y (c) del Teorema 6.1. 
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10. Sea T un operador lineal en un espacio vectorial dimensionalmente finito. 
Supóngase que \ u \ 2 , . . . , A* son los eigenvalores distintos de T y que el 
mayor bloque de Jordan correspondiente a A,- en una forma canónica de 
Jordan de T es de tamano p } x p v Demostrar que el polinon^io mínimo 
de T es 

(í ~ \\ ) Pl (t - A-2 ) Pi \k) Pk - 

6.2 FORMA CANONICA DE JORDAN ^ 

Para los fines de esta sección fijaremos un operador lineal T en un espacio 
vectorial rc-dimensional V tal que el polinomio característico de T se des- 
compone en un producto de factores de grado 1. Sean \ u \ 2ì . . . , \ k los 
distintos eigenvalores de T. 

EI Teorema 6.4 asegura la existencia de una base canónica de Jordan 
/? para T; esto es, J = [T]^ es una forma canónica de Jordan para T. Resu- 
mamos brevemente los resultados de la Sección 6.1. Para cada i — 1, 
2, . . . k existe una base /?* para K\. tal que /3; es una unión disjunta 
de ciclos correspondientes al eigenvalor A ; y 

Sea T i la restricción de T a K\ r Entonces A t — [T;]^ es una forma ca- 
nónica de Jordan para T ; y 

J = [T]yy — A x @ A z @ 0 A k 

es una forma canónica de Jordan para T. 

En esta sección calcularemos las matrices A } y las bases /?* calculan- 
do también así / y /3. Mientras se desarrolla un método para encontrar a 
/, se hará evidente que en cierto sentido las matrices A; son únicas. Lo 
que queremos decir por “en cierto sentido” se hará más claro a medida que 
avancemos. 

Para ayudarnos en la formulación de un teorema de unicidad para / 
adoptaremos la siguiente convención: La base /3; para Kx. se ordenará 
en adelante de tal modo que los ciclos aparecerán en orden de longitud 
decreciente. Esto es, si /3; es una unión disjunta de ciclos S u S 2 > . . . , S kt 
y si la longitud del ciclo Sj es p h pondremos índices a los ciclos de modo 
que Pi > Pi > ... > p k ,. Esta ordenación de los ciclos determina una or- 
denación para /J, y por lo tanto determina a la matriz A h Es en este sentido 
que la matriz A , es única. Se deduce entonces que la forma canónica de 
Jordan para T es única para un ordenamiento de los eigenvalores de T. 
Como también veremos, no existe ningún teorema de unicidad comparable 
para las bases /3; o para (3. Específicamente, lo que se demostrará es que 
el número k, de ciclos que forman a f3, y la longitud pj(j i= 1, 2, . .. , k,) 
de cada ciclo está completamente determinada por T. 
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Ejemplo 4. Para ilustrar que la matriz A x queda totalmente determinada 
por los números k u p u p 2 ,. . Pk { supóngase que k- t = 4 (esto es, exis- 
ten cuatro ciclos), = 3, p 2 = 3, p, = 2 y p 4 = 1. Entonces 


( x ‘ 

1 

0 

0 

0 

0 

0 

0 

°\ 

0 

A, 
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0 

0 

0 

0 

0 

0 

0 

0 

A, 

0 

0 

0 

0 

0 

0 

0 

0 

0 

A, 

1 

0 

0 

0 

0 

0 

0 

0 

0 

A, 

1 

0 

0 

0 

0 

0 

0 

0 

0 

A, 
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0 

0 

0 

0 

0 

0 ” 

..... 

” 0 ” 

AÏ 

..... 

j 0 

0 

0 

0 

0 

0 

0 

0 

A, 

0 

\0 

0 

0 

0 

0 

0 

" 0 " 

"ô" 

rv 


esto es, es una suma directa de la forma A ®/ 2 ® J 3 ® J*- 

Como una ayuda para calcular A i y /3 1 introduciremos un arreglo de 
puntos, llamado diagrama de purttos, para ayudarnos a visualizar la for- 
ma de la matriz A\ y de la base /?,. Supóngase, como antes, que f3 t es una 
unión disjunta de ciclos S u S 2y , S ki con longitudes respectivas > 
> P 2 > ... > Pkt . E1 diagrama de puntos contiene un punto para cada 
miembro de y se construye de acuerdo con las reglas siguientes. 

1. E1 arreglo consta de k t columnas (una columna para cada ciclo). 

2. Contando de izquierda a derecha, la columna / consta de p, pun- 
tos que corresponden a los miembros de S } de la siguiente manera: 
Si xj es el vector terminal de Sj entonces el punto de arriba co- 
rresponde a (T — À î l) p '~ 1 (*j); el segundo punto, a (T — X i l) Pí " 2 
(jcy); etc. Por lo tanto, el punto final (el de más abajo) de la 
columna corresponde a x } . 

Así, el diagrama asociado con /3i puede ser descrito como 

•(T - X t \)’r'( Xí ) .(T - X t \) p r'(x 2 ) ••• *(T — X t \y*r'(x k ) 

.(T - •CT-A < l)'.-*(* 2 ) *(T — A í l)' , * 1 - 2 (x* 1 ) 

.(T - A.IXxJ 

*(T 0(^2) mX ki 

*(T — A/IXxj) 

•Xi 

En el diagrama anterior hemos identificado cada punto con el miembro 
de pi al que corresponde. 
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Nótese que el diagrama de puntos para /3,- tiene k t columnas (una 
para cada ciclo) y p x renglones. Obsérvese también que como p x > p z > 
> . . . > p ki , las columnas del diagrama de puntos se hacen más cortas 
(o al menos no más largas) a medida que nos movemos de izquierda a 
derecha. 

Puede observarse también que si r, es el número de puntos en Ia 
columna j del arreglo, entonces r x > r > > ... > r Pl . Como la demostra- 
ción de este hecho es de naturaleza combinatoria, la dejaremos para los 
ejercicios. 

Regresando al Ejemplo 4, donde k t = 4, p, = 3, p 2 = 3, — 2 y 

p A — 1, vemos que el diagrama de puntos para /3; es 


Obtendremos un método para calcular el diagrama de puntos para /3i 
únioamente en términos de T, por lo que el diagrama de puntos queda deter- 
minado en forma única por T. Es importante, sin embargo, entender que 
cuando decimos que el diagrama de puntos queda únicamente determinado 
por T no estamos haciendo aseveraciones sobre la unicidad de /3,. De he- 
cho, como veremos, la base /3, no es única. Por la unicidad del diagrama 

de puntos entendemos que si /3* y /3' son dos bases canónicas de Jor- 

dan para Ka ( ., entonces los diagramas de puntos para /3 } y /3' son idénti- 
cos. Luego, si /3' es una unión disjunta de k'. ciclos de longitudes 

p\ >Pz> • * • >p'k t9 entonces k\ = k. y p\ =p Xy p\ = p 2 ,. . . ,p' kl = p ki . 

Para establecer este resultado de unicidad, utilizaremos el siguiente he- 
cho de carácter combinatorio: Cualquier diagrama de puntos queda comple- 
tamente determinado por el número de sus renglones y por el número de 
puntos en cada renglón. (Véase Ejercicio 7.) Así, si estos números pudieran 
obtenerse a partir de las propiedades intrínsecas de la transformación T 
(por ejemplo, como los rangos de (T — Àjl)' para distintos valores de /), 
se podría construir el diagrama de puntos y se demostraría la unicidad de 
•los números k h p u p 2 ,. . ., p ki . Los resultados siguientes proporcionan el 
método deseado para calcular dichos números. 

Teorema 6.6. Para cualquier entero positivo r los vectores de la base en 

que estén asociados con puntos en los primeros r renglones de un diagrama 
de puntos para fii forman una base para N((T — A L I) 1 ). Por lo tanto, el 
número de puntos en los primeros r renglones de un diagrama de puntos 
para /3 j es la nulidad de (T — AjI) r . 

demostración. Los vectores de la base en /3, que están asociados con 
puntos en Ios primeros r renglones de un diagrama de puntos para f3, son 
los primeros r elementos de los ciclos Sj(j = 1, 2, ... , k ,) que forman 
a /3j. Por lo tanto, estos vectores de la base son elementos de N((T — À;l) r ). 
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Además, estos vectores son linealmente independientes puesto que forman 
un subconjunto de , de manera que basta con demostrar que estos vecto- 
res de la base generan a N((T — \i\) r ). 

Para cada /(/ = 1, 2, ... , k\) y sea W ; = L(Sj). Como W 7 es T-inva- 
riante por el Ejercicio 3 de la Sección 6.1, es también (T — Ail) r -invarian- 
te. Además, de acuerdo con el Teorema 5.13, K Xt = Wj ® W 2 © • • • © 

Si or£N((T — Ail) r ), entonces por definición x£K\ ( . Luego existen ele- 
mentos únicos Wj ÇW 7 (/ = 1, 2, ... , ki) tales que x = w x + w 2 + ... + 
+ w ki . Por lo tanto 

o = (T - A,!)'(*) j 

= (T - A,l) r (*v,) + (T — A,l) r (*v 2 ) + • • • + (T — A,l) r (H-* f ). 

Se tiene que 

(T - ki\) r (wj) = 0 para / = 1, 2, . .. , k>. 

Supóngase para cada / que 


Sj = {(T - A,l+--'(x ; ), (T - A,l y>-\ Xj ) .(T — A,I)(jc ; ), Xj }. 

Entonces como 

w j = a p,- i(T ~ A,l+ • • • + a,(T - A,l)(jc y ) + 

Para algunos escalares a,,,.,,. .a„ a 0 , 

0 = (T - A,l) r (w y ) = a #í . r .,(T - A,!)"->(*,) + • • • + a 0 (T - A,l) r (jc y ). 

Dado que 5 ; es linealmente independiente, se tiene que a VrT = . .. = 
= «0 = 0. Por lo tanto 

= a p,-Á T - A,l) , -- , (jc y ) + a Prl (J - A,\y>- 2 ( Xj ) 

+ • • • + a p,-X T - A,l) , '- r (x J ). 

Esto es que w ; es una combinación Iineal de los vectores de la base en /?, 
que están asociados con puntos en los primeros r renglones de la colum- 
na j de un diagrama de puntos para /?,, y entonces X — + w 2 + ... + 

+ w k, cs una combinación lineal de miembros de /3, asociados con puntos 
en los primeros r renglones de un diagrama de puntos para /?,. Conclui- 
mos que estos vectores forman una base para N((T — A ; l) r ). ■ 

En el caso en que r = 1, el Teorema 6.6 da origen al corolario si- 
guiente. 

Corolario. Sea /?, una base canónìca de Jordan para la restricción de T a Kx, 
>’ supóngase que /3, es la unión disjunta de k ( ciclos de eigenvectores gene- 
ralizados correspondientes a A,. Entonces la dimensión de Ex, es igual a 
k„ Por lo tanto, en una forma canónica de Jordan para T, el número de 
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bloques de Jordan correspondienîes al eigenvalor X, es igual a la dimen- 
sión de E\. t . 

Ahora somos capaces de formular un procedimiento para calcular el 
diagrama de puntos para /?,• directamente a partir de T. 

Teorema 6.7. Sea rj el número de punîos en el renglón j de un diagrama de 
punîos para /3^. Entoncesj 

(a) ri = dim(y) — rango( T — Xjl). 

(b) Tj = rango(( T - Àj)^ 1 ) - rango(( T - ÀJV) si j > 1. 
demostración. De acuerdo con el Teorema 6.6, 

+ r 2 + ... i+ r } = nulidad((T — Àil)0 

= dim(V) — rango((T — ÀfOO para cualquier / > 1. 

Por lo tanto 


r x = dim(V) - rango((T — Àil) 1 ) 

y 

r$ = (n + r 2 + ... + r } ) — (r x + r 2 + . . . + r hl ) 

= (dim(V) — rango((T — ÀiOO) ” (dim(V) — rango((T — À^l) i-a )) 
= rango((T — Àil) M ) — rango((T — À/l)0 para / > 1. ■ 

Este teorema muestra que un diagrama de puntos para /?, está comple- 
tamente determinado por T. Por lo tanto hemos demostrado el siguiente 
resultado de unicidad. 

Corofar/o. Para cualquier eigenvaìor Àj de T el diagrama de puntos para /3, es 
único. Por lo tanto, sujeta a la convención de que los ciclos se encuentran 
en orden de longitud decreciente, la forma canónica de Jordan de un ope - 
rador lineal es única hasta el ordenamiento de sus eigenvalores. 

Antes de dar algunos ejemplos del uso del Teorema 6.7 definiremos 
de la manera evidente la forma canónica de Jordan para una matriz. 

Definición. Sea A una matriz de n x n con elementos de F tal que el polinomio 
característico de A (y por lo tanto de l A ) se descompone en un producto 
de factores de grado 1. Entonces la forma canónica de Jordan de A se defi - 
ne como la forma canónica de Jordan del operador lineal L A en F\ 

Obsérvese que si J es la forma canónica de Jordan de una matriz A , 
entonces J y A son similares. De hecho, si /3 = {z u z->, . . . , z») es una 
base canónica de Jordan para l Á y Q es la matriz de n x n que tiene a 
Zj como su columna /, entonces J = Q 'AQ en virtud del Teorema 5.1. 
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En los tres ejemplos siguientes calcularemos la forma canónica de Jor- 
dan para dos matrices y un operador lineal. , 

Ejemplo 5. Sea / 

/ 2-1 0 1 \ 

0 3-10 

“ 0 1 10 ' 

\0 -1 0 3/ 


Encontraremos la forma canónica de Jordan de A y una base canónica 
de Jordan para la transformación lineal L, t . E1 polinomio característico de 
A es 

det(;4 - tl) = (/ - 2) 3 (r - 3). 

Luego, A tiene dos eigenvalores distintos, = 2 y À 2 = 3 con multiplici- 
dades respectivas 3 y 1. 

Sea /?i una base canónica de Jordan para la restricción de l A para 
Como Ài tiene multiplicidad 3, dimí^O = 3 en virtud del Teorema 6.5. 
De modo que el diagrama de puntos para contiene tres puntos. Como 
antes, sea r, el número de puntos en el renglón / del diagrama. Aplicando 
el Teorema 6.7 tenemos 


r x — 4 — rangoM — 27) = 4 — rango 


0 

0 


-1 

1 

1 

-1 


0 l\ 
1 0 
1 0 
0 l/ 


y 


r> — rango(.4 — 27) — rango ((A — 2/) 2 ) —2 —1 = 1. 


(En realidad, en este caso no es necesario calcular a r 2 . Hubiéramos podido 
deducir que r> = 1 del hecho de que r x = 2 y que el diagrama tiene tres 
puntos.) Por lo tanto, el diagrama de puntos asociado con es 


Así, si Ti es la restricción de l A a Ka, (/ — 1, 2), debemos tener que 

/ 2 1 °\ 

A=[T,]„ = 0 2 0. 

\o 0 2 / 

Como dim(Kx.,) — 1, cualquier para Ka,, estará formada de un eigen- 
vector único que corresponde a À 2 — 3. Entonces 

A s - UAíu= (3). 



Forma canónica de Jordan 345 


Haciendo /3 = U /? L >, tenemos que 


J — [LJ^ — A x © A 2 



1 

0 

°\ 

0 

2 

0 

0 

0 

0 

2 

0 

*o“ 

’ô" 

o’ 

3/ 


y por îo tanto / es la forma canónica de Jordan para A. 

Busquemos ahora una base canónica de Jordan para T — l A , para lo 
cual debemos encontrar primero una base canónica de Jordan /?i para Ti. 
Sabemos de los cálculos anteriores que el diagrama de puntos correspon- 
diente a debe ser 


•(T - ^/0(*i) 

•*i 


De este diagrama vemos que debemos seleccionar a tal que *i €N((T 
— Àj) 2 ) pero que JCj^N((T — Àj) 1 )- Como 



-1 

0 

1\ 


/0 

-2 

1 

1\ 

0 

1 

-1 

o' 

, (A - 2 iy = 

0 

0 

0 

0 

0 

1 

-1 

°i 

0 

0 

0 

0 


-1 

0 

J 


lo 

-2 

1 

1/ 


2 / = 


Se puede ver ahora fácilmente que 


0 

0 

\ 0 / 


/°\ 

1 

2 

\ 0 / 


/ 0 \ 

1 

0 

\ 2 / 


es una base para N((T - AJ) 2 ) = K v De estos vectores básicos, 


1°) 


f°\ 

1 


1 

2 j 

y 

0 

\°J 


\ 2 I 


satisfacen la condición de no pertenecer a N((T — A, I) 1 ). Por lo tanto 
podemos seleccionar a de manera que sea cualquiera de los dos vecto- 
res. Tomaremos 

/ 0 \ 

1 


x, = 


2 

\ 0 / 
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Entonces 




/0 

-1 

0 

1\ 

(°\ 


— 1 \ 

H 

1 

II 

£ 

1 

2I){ Xì ) = 

0 

1 

-1 

0 

1 1 


-j> 


0 

1 

-1 

0 

2 


-i 



\0 

-1 

0 

1/ 

\oj 

1 

i-i/ 

Ahora simplemente tómese 

a x 2 como un 

elemento 

de 

Ea, 

que 

sea 


mente independiente de 


(T — AjIXxj) = 


/— 1 \ 
-1 
-1 
\-l/ 


por ejemplo, selecciónese 


x 2 = 


/ 1 \ 

0 

0 

\ 0 / 


Así, hemos asociado la base canónica de Jordan 


(~ l \ 


1 °) 


( l \ 

f-l' 


l' 


0 

i _1 | 

» 

2 | 

9 

0 

i-1/ 


ioJ 


i 0/ 


con el diagrama de puntos de la siguiente manera: 


l-'\ 


t l \ 

-1 


fo 

_1 J 


0 

\-l/ 

f 

i 0/ 


/°\ 

1 

2 

\ol 


A1 lector podría preocuparle que no se haya verificado la independen- 
cia lineal de /3,. Sin embargo, debe estar seguro de que esta verifioación no 
es necesaria en virtud del lema del Teorema 6.4. Dado que se seleccionó 
a x■■ tal que fuera linealmente independiente del vector inicial (T — A,l) (x t ) 
del ciclo {(T — A,!)(*,), jr,}, se deduce de este lema que /?, es lineal- 
mente independiente. 
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Cualquier eigenvector de l A que corresponda al eigenvalor A 2 
mará la base deseada /? 2 para Kx, —por ejemplo, 


= 3 for- 


ih 


Así, 


/1 \ 
0 
0 

\ 1 / 


P = Pl U 02 




/0\ 

1 

/ 1 \ 

1-1 


1 


0 

-1 

» 

2 

> 

0 

[-11 


\oi 


ioj 


/1 \ 
0 
0 

\ 1 / 


es una base canónica de Jordan para U. 
Nótese que si 


l-l 0 1 



\-l 0 0 

entonces / = Qr'AQ. 


1 \ 

0 

0 

1 / 


Ejemplo 6. Sea 


2 

-4 

2 

2 \ 

-2 

0 

1 

3 

-2 

-2 

3 

3 

1-2 

-6 

3 

7/ 


De nuevo encontraremos una forma canónica de Jordan de / para A y 
una matriz Q tal que / = Q~'AQ. 

E1 polinomio característico de A es det (A — tl ) = (t — 2 ) 2 (l — 4) 2 . 
Sean X, = 2, X 2 = 4 y /? 4 la base canónica de Jordan para T ; , la restric- 
ción de a Ka ( , para i = 1, 2 . 

Principiamos calculando el diagrama de puntos para /3,. Sea r x el 
número de puntos en el primer renglón de este diagrama; entonces r, 

= 4 — rango (A — 2 /) = 4 — 2 = 2, de modo que el diagrama de pun- 
tos para /3, es 


Entonces 

A ‘ = = (o “)• 

Calcularemos ahora el diagrama de puntos para (3... Como rango (A — 
- 4 /) = 3 ; existe únicamente 4-3 = 1 punto en el primer renglón del 
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diagrama. Como Ka 2 tiene dimensión 2 (Teorema 6.5), el diagrama de 
puntos para /? 2 debe ser 


'ì 


Luego 


^ = = i)- 

Entonces si /? = /3, U /? 2 , la forma canónica de Jordan de L.i es 



0 

0 

°\ 

0 

2 

0 

0 

ò" 

'o' 

4’ 

î 

\0 

0 

0 

4/ 


Con el objeto de encontrar una matriz Q tal que Q 'AQ = J, primero 
debemos encontrar una base canónica de Jordan /3 para T. EI diagrama 
de puntos para /?, indica que /?i se puede escoger como cuaiquier conjunto 
linealmente independiente de eigenvalores de A correspondientes a A t = 2. 
Por ejemplo, 


r 

2\ 


/°\) 


1 


ll 


j 0 1 

> 

2 

I 


\2f 


io/. 


será suficiente. Para /? 2 debemos encontrar un elemento £ K\, = 
— N((U — A 2 I) 2 ) tal que x,$N( (L 4 — A^l) 1 ). Una manera para encon- 
trar dicho elemento fue utilizada en el Ejemplo 5 para seleccionar al vector 
Xl En este ejemplo ilustraremos otro método para obtener tal vector. Un 
cálculo sencillo muestra que una base para el espacio nulo de i A — A 2 I es 


7 °\ 

1 

1 

\l/. 

Sea 

/°\ 

(A — 4/)(.v,) = | 

\ 1 / 
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y tómese a x, tal que sea la preimagen de 


(°\ 

1 

1 

\l/ 

Para realizar esta operación debemos encontrar una solución a 
ción matricial 



esto es 


1—2 -4 2 2\ 

í û \ 


f0\ 

-2-4 13 

b 1 


1 

-2 -2 -1 3 

C í 


1 

\—2 -6 3 3/ 

\d 1 


1 / 


Puede verificarse fácilmente que 


l"] 


i\ 

b ' 


-1 

C 1 


-1 

\d) 


01 


es una solución; de esta manera tenemos 


= 


/ *\ 

-1 

-1 

\ 0 / 


Entonces 




/ 0 \ 
1 
1 

l\l/ 


/ 1 \ 
-1 
-1 
\ 0 / 


Por lo tanto 


P — fi\ u p 2 ■— 


í 2 \ 

l 

/0\ 

i 

/°\ 



'l' 


1 


1 


-1 

i°í 

» 

2 

» 

1 

* 

~1 

uJ 


loj 


1 / 


\ 0 i 


la ecua- 


es una base canónica de Jordan para L A . 
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Así, si 

0 0 1 \ 

1 1 -1 
2 1 - 1 ’ 

0 1 0/ 

entonces J — Qr'AQ. 

Ejemplo 7. Sea V el espacio vectorial de las funciones polinómicas sobre 
R en dos variables x e y de grado a lo más 2. (Una base para V es 
a = {1, x, y, x 2 , y 2 , xy}.) Considérese el mapeo T: V-»V definido por 


/2 



\2 


T (/) 



Por ejemplo, si f(x, y) = x r 2x 2 — 3 xy + y, entonces 
T(/) =4-f(*> y) = 1 + 4*- 3y. 


Encontraremos una base canónica de Jordan para T. 
Primero, obsérvese que si A = [T]«, entonces 


/0 1 0 0 0 0 \ 

0 0 0 2 0 0 

0 0 0 0 0 1 

0 0 0 0 0 0 

0 0 0 0 0 0 

(0 0 0 0 0 0 / 


Así, el polinomio característico de T es 


det(^4 — 


tl) = det 


I-t 

0 

0 

0 

0 

0 


1 

—t 

0 

0 

0 

0 


0 

0 

—t 

0 

0 

0 


0 0 0\ 

2 0 0 

0 0 1 

-t 0 0 

0 -t 0 

0 0 -t) 


Por lo tanto T tiene únicamente un eigenvalor (A = 0) y K\ = V. Sea p 
cualquier base canónica de Jordan para T. Si r- t es el número de puntos 
en el renglón i del diagrama de puntos para (J entonces r, — 6 — rango(/4) 
(A) = 6-3 = 3. 
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Como 

/0 0 0 2 0 0 \ 

0 0 0 0 0 0 

2 oooooo 
^“oooooo’ 

0 0 0 0 0 0 

\o 0 0 0 0 0/ 

r 2 = rango (A) — rango(/4-) = 3—1 = 2. Entonces dado que r x = 3, 
r ., = 2 y como existen seis puntos en el diagrama, se tiene que r 3 = 1, por 
lo que el diagrama de puntos para /î es 


Concluimos que la forma canónica de Jordan / de T es 


/0 

1 

0 

0 

0 

0\ 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

o’ 

T 

"ô~ 

T 

1 

0 

0 

0 

0 

0 

0 

0 

\0 

0 

0 

T 

0 

'o) 


Buscaremos ahora una base canónica de Jordan para T. Como la pri- 
mera columna del diagrama de puntos para /3 está formada por tres puntos, 
debemos encontrar un vector Xi tal que 

3* 

-frU )¥=<>. 

dx* 

Examinando la base « = (1, x, y, x-, y‘, xy} para Kx, vemos que x- es un 
candidato para JCi. Haciendo = x- encontramos que 

d 

(T - AOÍXi) = T(jc!) = — (jci) = 2x y 

<3X 

(T - Al)-( jci) = T 2 (JCi) = ^0*0 = 2 - 

De la misma manera, dado que la segunda columna del diagrama de pun- 
tos para /3 está formada por dos puntos, debemos encontrar un vector jc, 
tal que 
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Examinando a a con 1, x y x- no consideradas (porque están dentro del 
subespacio generado por el ciclo {2, 2x, x 2 }), vemos que podemos escoger 
x 2 — xy. Así 

(T - XI) (x 2 ) = T(jf a ) = ^-(xy) = y. 

ôx 

Finalmente, selecciónese x* — y-. Así habremos identificado la siguiente 
base con el diagrama de puntos 

•2 -y •y 2 

• 2x *xy 

• x 1 

Luego entonces, /? = {2, 2x , x 2 , y, xy , y 2 } es una base canónica de Jordan 
para T. 

En los tres ejemplos anteriores aprovechamos nuestro ingenio, así como 
el contexto del problema para encontrar una base canónica de Jordan. 
E1 lector será capaz de realizar lo mismo en los ejercicios. Tuvimos éxito 
en estos casos por el hecho de que las dimensiones de los eigenespacios 
considerados eran pequehas. No trataremos, sin embargo, de desarrollar 
un algoritmo general para calcular una base canónica de Jordan aun cuan- 
do se podría formular uno siguiendo los pasos de la demostración de la 
existencia de tal base (Teorema 6.4). 

E1 siguiente resultado puede ser considerado como un corolario del 
Teorema 6.7. 

Teorema 6.8. Sean A y B dos matrices cuadradas del mismo tamano , cada una 
con formas canónicas de Jordan calculadas de acuerdo con las convencio- 
nes de esta sección. Entonces A y B son similares si y sólo si tienen la 
misma forma canónica de Jordan (hasta una permutación de sus eigen- 
valores). 

demostración. Si A y B tienen la misma forma canónica de Jordan /, 
entonces A y B son ambas similares a / y por lo tanto son similares en- 
tre sí. 

Recíprocamente, supóngase que A y B son similares. Entonces A y 
B deben tener los mismos eigenvalores con las mismas multiplicidades. 
Sean / , y J l{ respectivamente las formas canónicas de Jordan de A y B 
para algún orden fijo de sus eigenvalores. Entonces como A es similar a 
/.i y B es similar a J n , la hipótesis implica que J A y J H son similares. 
Por lo tanto, de acuerdo con el Ejercicio 19 de la Sección 5.1, existe un 
operador lineal T en un espacio vectorial dimensionalmente finito V, así 
como bases /3 y y para V tales que [T ] (3 = J A y [T] y = J H . Entonces J A 
y Jiì son formas canónicas de Jordan para el mismo operador lineal. Por 
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lo tanto, como los eigenvalores de A y B están ordenados en la misma 
forma, el corolario al Teorema 6.7 implica que J A = J H . ■ 

Ejemplo 8. Determinaremos cuáles de las siguientes matrices son simi- 
lares. 



Obsérvese que A, B y C tienen el mismo polinomio característico (t 
- 1)(/ - 2) 2 , mientras que D tiene a -t(t - ì)(t~ 2) como polinomio 
característico. Entonces, como matrices similares tienen los mismos poli- 
nomios característicos, D no puede ser semejante a A, B o C. Ahora bien, 
cada una de las matrices A, B y C tiene los mismos eigenvalores Ài — 1 
y = 2 con multiplicidades respectivas de 1 y 2. Si J Ay J B y Jc son res- 
pectivamente las formas canónicas de Jordan de A, B y C, con respecto 
a este orden de sus eigenvalores, entonces 



Como J A = J c , A es similar a C, mientras que B no es similar ni a A 
ni a C. 

E1 lector debería observar que cualquier matriz diagonal es una forma 
canónica de Jordan, de manera que T es diagonalizable si y sólo si su 
forma canónica de Jordan es una matriz diagonal. Por lo tanto, si T es 
un operador diagonalizable en V, cualquier base canonica ,de Jordan para 
T es una base para V formada por eigenvectores de T. 


EJERCICI OS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) La forma canónica de Jordan de una matriz diagonal es la matriz 
misma. 

(b) Sea T un operador lineal en un espacio vectorial dimensionalmente fi- 
nito V que tiene una forma canónica de Jordan /. Si /3 es cualquier 
base para V, entonces la forma canónica de Jordan para [T]$ es /. 

(c) Operadores lineales con el mismo polinomio característico son simi- 
lares. 
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(d) Matrices con la misma forma canónica de Jordan son similares. 

(e) Toda matriz es similar a su forma canónica de Jordan. 

(f) Sea T un operador lineal en un espacio vectorial dimensionalmente fi- 
nito con polinomio característico ( — l) w (í — A) n . T tiene una forma 
canónica de Jordan única, sujeto a la convención de que los bloques 
de Jordan estén ordenados por tamanos decrecientes. 

(g) Si un operador tiene una forma canónica de Jordan, entonces existe 
una base canónica de Jordan única para ese operador. 

(h) E1 diagrama de puntos de cualquier operador lineal que tenga una 
forma canónica de Jordan es único. 

2. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal que el polinomio característico de T se descompone en un producto de 
factores de grado 1. Sean A x = 2, À 2 = 4 y À* = — 3 los distintos eigen- 
valores de T y supóngase que los diagramas de puntos para la restricción de 
T — Ail a K\.(i = 1, 2, 3) son los siguientes: 

Aj = 2 A,=4 A 3 = —3 


Encontrar la forma canónica de Jordan de T. 

3. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal que la forma canónica de Jordan de T es 


/2 

1 

0 

0 

0 

0 

°\ 

0 

2 

1 

0 

0 

0 

0 

0 

0 

2 

0 

0 

0 

0 

0 

0 

0 

2 

1 

0 

0 

0 

0 

0 

0 

2 

0 

0 

0 

0 

0 

o’ 

T 

3 

0 

\o 

0 

0 

0 

0 

0 

3/ 


(a) Encontrar el polinomio caracteristico de T. 

(b) Encontrar el diagrama de puntos correspondiente a cada eigenvalor 
de T. 

(c) ^Para cuáles eigenvalores A if si es que hay alguno, se tiene que 

- K Xí ? 

(d) Para cada eigenvalor A* encontrar el entero positivo más pequeno p t 
para el cual Ka, — N((T — A t l )''*). 

(e) Sea 11* la restricción de T — AjI a K\< para cada /. Calcular para cada /: 
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(i) rango(U,) 

(ii) rango(U^) 

(iii) nuIidad(Uj) 

(iv) nulidad(Up 

4. Para cada una de las siguientes matrices A , encontrar una forma canónica 
de Jordan J y una matriz Q tal que J = Q X AQ. 



(c) / 0 -1 -1\ (d) /0-3 1 2\ 

~ 3 -1 -2 A = \ 2 1 _1 2 

\ 7 5 6/ ~-21-12 

\—2 -3 1 4/ 

Nótese que las matrices de los incisos (a), (b) y (c) son matrices utili- 
zadas en el Ejemplo 8. 

5. Sea A una matriz d c n x n cuyo polinomio característico se descompone en 
un producto de factores de grado 1. Demostrar que A y A l tienen la mis- 
ma forma canónica de Jordan y concluir que A y A* son similares. Suge- 
rencia: Para cualquier eigenvalor A de A y A 1 y cualquier entero positivo 
r, demostrar que rango((^ - Al) r ) = rango((,4' — Al) r ). 

6. Sea V el espacio vectorial de las funciones que son combinaciones lineales 
de e'\ xe r , y e 2x . Defínase T: V V mediante T(/) = /' (la derivada de 
/). Encontrar una forma canónica de Jordan así como una base canónica 
de Jordan para T. 

7. Supóngase que un arreglo de puntos (tales como un diagrama de puntos) 
tiene k columnas y m renglones y que la columna i del arreglo contiene pi 
puntos y el renglón i del arreglo contiene r t puntos. Si p x > p 2 > ... > 
demostrar las siguientes proposiciones: 

(a) m = pi y h = r x . 

(b) pi = max{/: r } > /} para 1 < i < k y r { = max{/: p } > /} para 
1 < i < m. Sugerencia: Utilizar inducción sobre m. 

(c) r t > r, > . . . > r m . 

(d) Conclúyase que el número de puntos en cada columna de un dia- 
grama de puntos queda completamente determinado si se conoce el 
número de puntos en cada renglón. 

Definición. Un operador lineal T en V se llama nilpotente si T p = T 0 para algún 
enîero posiîivo p. 
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8 . Demostrar que si T es un operador nilpotente en un espacio vectorial n- di- 
mensional V, entonces el polinomio característico de T es ( —l) n r. Por lo 
tanto, el polinomio característico de T se descompone en un producto de 
factores de grado 1 y T tiene únicamente un eigenvalor (cero) de multipli- 
cidad n. Sugerencia: Utilizar inducción sobre n. En el paso general, supón- 
gase que la conclusión es verdadera para todos los espacios vectoriales de 
dimensión menor que n y síganse los pasos siguientes. 

(a) Demostrar que T tiene al menos un eigenvector correspondiente a 
A«= 0. Luego dim(R(T)) < dim(V) = n. 

(b) Aplicar la hipótesis de induceión al subespacio T-invariante R(T). 

(c) Extiéndase una base {x u jc 2 , . . , x k } para R(T) hasta una base p = 
— (jfi, Xo j . • . > Xk) . .. , x n ) para V. 

(d) Demostrar que 



donde O y O’ son, respectivamente, matrices nulas de (n — k) X k 
y (n - k) x (n- k). 

(e) Dedúzcase que det(T — t\) = ( —l) w r. 

9. Demostrar la recíproca del Ejercicio 8: Si T es un operador lineal en V 
que tenga a ( — l) w r, como polinomio característico, entonces T es nil- 
potente. 

10. Dar un ejemplo de un operador lineal T tal que T no sea nilpotente pero 
que el cero sea el único eigenvalor de T. Caracterizar a todas estas trans- 
formaciones. 

Definición. Una matriz A de n x n se llama nilpotente si A p es igual a îa matrìz 
cero de n x n para algún entero positivo p. 

11. Sea A £M llxn (F). Demostrar que A p = O, donde O es Ìa matriz nula de 
n x si y sólo si (l A ) v = T 0 . Conclúyase que A es nilpotente si y sólo 
si l Á es nilpotente. 

12. Demostrar que cualquier matriz triangular cuadrada con todos los elemen- 
tos de la diagonal iguales a cero es nilpotente. 

13. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
tal que el polinomio característico de T se descomponga en un producto de 
factores de grado 1. Sean X u A 2 , . . . , X k los distintos eigenvalores de T. 
Como V = K Xl © K Xi @ * • • © K Xk , podemos definir un mapeo U: V —> V 
de la siguiente manera: Para xÇV, donde x = x Y + x., 4- ... + Xn con 
jc i£K\ if defínase 

U(jc) - (T-AxDÍJti) + (T — A 2 I)(jc 3 ) + ... + (1 ~ X k \)(x k ). 
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Demostrar que 

(a) U es un operador lineal. 

(b) U es nilpotente. 

(c) UT = TU. 


14. Sean T y U como en el Ejercicio 13. Supóngase que /3 * es una base canónica 
de Jordan de la restricción de T a K\., y sea J t la forma canónica de 
Jordan para esta restricción. Entonces f3 — U (3 2 U ... U /3 k es una base 
canónica de Jordan para T. Sean / = [T]p y S = T — U. Demostrar los si- 
guientes incisos: 


(a) [S]p es una matriz diagonal cuyos elementos de la diagonal son idén- 
ticos a Ios elementos de la diagonal de /; esto es, si D = [S]p, entonces 




D» = 

(b) 

Si M = [1% 

entonces 



Mij = 

(c) 

J = D + M. 


(d) 

MD = DM. 


(e) 

Como consecuencia de' 


/ ij 

0 


si i — j 

en cualquier otro caso. 


si j = í 4- 1 
en cualquier otro caso. 


mial para /. Sea p el entero positivo más pequeno para el cual M p 
es igual a la matriz nula. Entonces 

J' = D r + rD r 'M + — - D' -M 2 + . .. + 


+ rDM rl + M r 


si r < p. 


y 

J r = D r + rD r l M + — - ~ — D r -M 2 + . .. + 


+ 


(r 


r\ 

7+ 1)!(P - 1)! 




si r > p. 


(f) Si T — L t , entonces existe una matriz Q tal que A = QJQ L 

(g) Para Ia matriz anterior g y para cualquier entero positivo r, = 

= Qi'Qr'. 


15. Sea T un operador lineal nilpotente en un espacio vectorial dimensionalmen- 
te finito V. Recuérdese del Ejercicio 8 que A = 0 es el único eigenvalor 
de T; por lo tanto V = Ka. Sea f3 una base canónica de Jordan para T. 
Demostrar que para cualquier entero positivo /, si suprimimos de J3 los vec- 
tores correspondientes a los últimos i puntos en cada columna de un 
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diagrama de puntos para /3, el conjunto resultante es una base para RCT*)- 
(Si una columna del diagrama de puntos contiene menos de i puntos, todos 
los vectores asociados con esa columna serán eliminados de /3.) 

16. Encontrar un operador lineal en un espacio vectorial dimensionalmente fi- 
nito que tenga dos bases canónicas de Jordan distintas. 

17. Sea T un operador lineal y sea À un eigenvalor de T. 

(a) Demostrar que dim(Kx) es la suma de las longitudes de todos los 
bloques correspondientes a À en la forma canónica de Jordan de T. 

(b) Deducir que E\ = K\ si y sólo si todos los bloques de Jordan corres- 
pondientes a À son de 1 x 1. 

18. (a) Sea J el bloque de Jordan correspondiente al eigenvalor À de una ma- 

triz; entonces 

/1 1 0 ••• 0\ 

0 X 1 ... 0 

o o x -.. 0 

/= • • • 

0 0 0 ... 1 

\0 0 0 ... X/ 

Supóngase que J es de m X m y sea N = J — À/ m . Demostrar que 
N m es la matriz nula. 

(b) Obsérvese, como en el Ejercicio 14, que para cualquier r > m 

r(r — 1) 

J r = À7 m + rÀ r ~W + . v - 2! . - À r -W 2 + . . . + 




Demostrar que existe lim J' si y sólo si una de las siguientes condi- 
ciones se cumple: r 


(i) | À | < 1. 

(ii) À = 1 y m = 1. 
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Además, demostrar que lim/' es la matriz nula si se cumple (i) y 

r * x 

que es la matriz (I) si se cumple (ii). 

(c) Demostrar el Teorema 5.16. 

19. Para cualquier A £AA llxIl (C) defínase || A || = max{| A v] |: 1 < /, / < n}. 

Demostrar los siguientes resultados para cualesquiera A, B ÇM Jìxn (C) y 
c£C. 

(a) I|/Í||>0y||i4|| = 0siy sólo si A es la matriz nula. 

(b) || cA || = | c | • || A ||. 

(c) \\A +B|| < \\A || + ||B||. 

(d) || AB || < n II A || • || B ||. 

20. Sean A £M 11X11 (/Î) una matriz de transición y P 'AP — J la forma canónica 
de Jordan de A. Sea || • || como se definió en el Ejercicio 19. 

(a) Demostrar que para todo entero positivo m, || A m || < 1. 

(b) Deducir que {|| J'" ||: m = 1, 2, . . .} está acotada. 

(c) Utilizando el inciso (b) anterior y el Ejercicio 18(b), demostrar que 
cada bloque de Jordan correspondiente al eigenvalor A = 1 de A 
es de 1 x 1. 

(d) Utilizando el inciso (c), el Teorema 5.16 y el Ejercicio 18(b), demos- 
trar que lim A m existe si y sólo si A tiene la propiedad de que 

■m * * 

siempre que X sea un eigenvalor de A con | X | = 1, entonces A = 1. 

(e) Demostrar el Teorema 5.23(a) utilizando al inciso (c) y el Teore- 
ma 5.22. 

21. (Este ejercicio requiere de conocimientos acerca de series absolutamente 
convergentes.) Recuérdese de la p. 297 que si A Ç M nxll (C), entonces e A 
se define como lim B my donde 

■m * '■* 

A 2 A m 

B m : =I + A+ — + ... + —T - * 

2! m! 

Utilizar el Ejercicio 19(d) para demostrar que e A existe para cada 
A € M llxll (C). 


6.3* FORMA CANONICA RACIONAL 

A lo largo de los Capítulos 5 y 6 hemos estado utiîizando los eigenvalores 
y los eigenvectores en nuestro análisis sobre operadores lineales en un 
espacio vectorial dimensionalmente infinito y, como hemos visto, son 
herramientas útiles siempre y cuando el polinomio característico del ope- 
rador lineal se descomponga en un producto de factores de grado 1. Exis- 
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ten, sin embargo, operadores lineales donde éste no es el caso. En efecto, 
existen operadores lineales sin eigenvalores. Lo que debe hacerse en estos 
casos es generalizar los conceptos de eigenvalor y de eigenvector con el 
objeto de obtener teoremas estructurales para reemplazar a los que encon- 
tramos en las secciones anteriores. 

Dado un operador lineal T en un espacio vectorial dimensionalmente 
finito V con un polinomio característico f(t), podemos siempre descompo- 
ner a /(/) de manera única como un producto de potencias de distintos 
polinomios mónicos irreducibles multiplicados por ( — l) w , donde n ~ 
= dim(V). Entonces 

f(t) = (-1 ) n (M0) n '(Mt)) n ' • • • (M*)) nk , 

donde <j>i(t) es un polinomio mónico irreducible de grado positivo, n, es 
un entero positivo (/—1,2,...,/:) y <j> t (t) =£ <j>j(t) para i^j. Esto 
se obtiene directamente del teorema de factorización única del Apéndice E. 
En caso de que f(t) se descomponga en un producto de factores de grado 
1, <j>i(t) ~ t — Xi para algún eigenvalor A*(/ =1,2,..., k). En este caso 
existe una correspondencia uno-a-uno entre el conjunto de los distintos 
eigenvalores y el conjunto de los distintos factores mónicos irreducibles 
del polinomio característico. En el caso general pueden no existir eigen- 
valores, pero los factores mónicos irreducibles siempre existen. Por esto, 
es razonable buscar teoremas estructurales basados en los factores mónicos 
irreducibles del polinomio característico en vez de en los eigenvalores y 
los eigenvectores. 

En esta sección consideraremos algunos teoremas estructurales que per- 
tenezcan a esta situación más general. Para cualquier operador lineal T 
en un espacio vectorial dimensionalmente finito V, veremos que V puede 
descomponerse como una suma directa de subespacios T-cíclicos. Además, 
imponiendo ciertos requerimientos adicionales que relacionen a los sub- 
espacios T-cíclicos en la suma con los factores mónicos irreducibles del 
polinomio característico de T, obtendremos un teorema de unicidad que 
involucra a algunas propiedades de estos subespacios T-cícIicos. Consecuen- 
temente, será posible escoger una base fB para V con el objeto de obtener 
una matriz [T]^ que sea única para T de la misma manera en que la forma 
canónica de Jordan de un operador es única para ese operador. Esta 
matriz será denominada “forma canónica racional” de T. Esta forma 
podrá utilizarse en lugar de la forma canónica de Jordan en caso de que 
el polinomio característico de T no se descomponga en un producto de 
factores de grado 1. 

En este punto, sería de mucha ayuda para el lector repasar las defini- 
ciones y las técnicas utilizadas en las Secciones 5.4 y 5.5. En particular, el 
lector debería estudiar los subespacios cíclicos y las matrices companeras 
y observar la relación existente entre ellos. Esta relación es tan importante 
para nuestro desarrollo que deseamos recalcarla en este momento: Dado 
un operador lineal T en un espacio vectorial dimensionalmente finito V 
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y un vector no nulo x Ç V, supóngase que el subespacio T-cíclico de V 
generado por jc, C x tiene dimensión d > 0. Se tiene de la Sección 5.4 
que (3 — {x, T(jc), . . . , T rf “ l (-*)} es u° a base ordenada para C x . Luego 
T d (x) es una combinación de f3, digamos 

T d (x) = -a„x - aj(x) - ... - a d .,T d ^(x) 

para escalares únicos — a 0 , —a u . . . , —a d . u (Hemos utilizado ~a t en 
vez de a, por conveniencia en la notación.) Como C T es un subespacio 
T-invariante de V, podemos considerar la restricción de T a C x , T Cjr . Como 
ya hemos visto, 

0 ~a 0 \ 

0 —a x 
0 —a 2 


1 ~a d .J 

Esta matriz tiene el polinomio característico 

f(t) = (~\) d (a 0 + a,t+ ... + a'd-if 1 - 1 + t d ) 

y se denomina matriz compafiera de /(/)• Como consecuencia del Teore- 
ma 5.32, el polinomio 

p(t) — a 0 ~r aj a d ~\t+ r + t d 

es el polinomio mínimo de T Cx . Además, de acuerdo con el Ejercicio 14 
de la Sección 5.6, el polinomio p(t) es el T-aniquilador de x. (A propósi- 
to, es esencial para el lector realizar los Ejercicios 13 y 14 de la Sección 
5.6 porque serán necesarios para establecer algunos de los resultados de 
esta sección.) 

Considérese de nuevo el operador lineal anterior T. Supóngase que V 
se descompone en una suma directa de subespacios T-cíclicos 


PcJ, = 


/0 0 
1 0 
0 1 


\0 0 


V = C XI © C Xi © • ♦ • © c* t 

para algunos vectores no nulos x u x->, . . . , x* en V, donde dim(C x .) = di 
para cada /. Si /+ — T(Xj), ... , T di ^(x t )} y (3= U (3 2 U ... U p k , 
entonces J3 es una base para V y 

m, - [Tc J#. © [U. © • • * © [T C 

en virtud del Teorema 5.26. Nótese que [T]p es una suma directa' de 
matrices companeras. Podemos resumir lo anterior de la manera siguiente. 

Teorema 6.9. Sea T un operador lineal en un espacio vectorial dimensionalmen - 
te finito V. Si V se puede descomponer como una suma directa de subes- 
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pacios T -cíclicos, entonces exisle una base (3 para V tal que [T]^ es una 
suma directa de matrices companeras. 

Como enunciamos anteriormente, el objeto de esta sección es demos- 
trar que siempre se puede descomponer a V en una suma directa de sub- 
espacios T-cícIicos. Además, se demostrará que siempre es posible escoger 
cada subespacio T-cíclico C,. tal que el aniquilador de x sea de la forma 
( <j>(t)) m , donde </>(0 es un factor mónico irreducible del polinomio carac- 
terístico de T y m es un entero positivo. La ventaja de esta descomposición 
es que la matriz correspondiente a una base seleccionada tal como en el 
Teorema 6.9 es esencialmente única (sujeta a ciertas convenciones que 
implican el orden de los subespacios cíclicos). 

La exposición anterior nos conduce a la definición siguiente. 

Definición. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V y sea f3 una base ordenada para V. La matriz. [T]^ se llamará forma 
canónica racional de T si 

[T]y? — Cj @ C 2 © • • • © C k , 

donde cada es la matriz companera de un polinomio de la forma 
( — I ) nul (</>(t))'", </>(t) es un factor mónico irreducible del polinomio carac - 
teristico de T, d es el grado de <£(t) y m es un entero positivo. 

E1 siguiente resultado es simplemente otra forma de enunciar el Teore- 
ma 6.9 con Ia terminología anterior. 

Corolario. Sea T un operador lineal en un espacio vectonal dimensionalmente 
finito V. Si V puede descomponerse como una suma directa de subespacios 
T -cíclicos 

V = C X1 © c Xî © ... © c Xk 

tales que para cada i, Xj tiene un aniquilador (</>j (t) ) lni , donde </>j(t) es 
un factor mónico irreducible del polinomio característico de T y m, es un 
entero positivo, entonces T tiene una forma canónica racional. 

En el Teorema 6.5 vimos que si ei polinomio característico de un 
operador lineal T en un espacio vectorial dimensionalmente finito V se 
descompone en un producto de factores de grado 1, entonces 

V = K Ai © K Xì © • • • © K XkJ 

donde À,, à 2 , • . . , À/. son los distintos eigenvalores de T. Nuestro siguiente 
resultado será semejante al del Teorema 6.5 en el caso de que ei polinomio 
característico de T no se descomponga en factores de grado 1. Primero, 
sin embargo, introduciremos el análogo de los eigenespacios generaliza- 
dos de T. 
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Definición . Sea T un operador lineal en un espacio veetorial dimensionalmente 
finiío V con polinomio caracteríslico 

f(t) = (-1) ,, (^.(t)) ,, '(^ 2 (t)) ,, = ... (</>, (t))»% 

dorn/e </>,(t), ^> 2 (t), ... , </>,(t) son distintos polinomios mónicos irredu - 
cibies y n, n,, n„ ... , n, enteros positivos. Para cada i - 1 , 2, . . . , r, 
defínase 

K fì = N( (</>, (T) 

Obsérvese que para cualquier polinomio g(0, T conmuta con g(T). 
Por lo tanto, cada K* ( es T-invariante. Además, si />(() es el polinomio 
mínimo de T, entonces de acuerdo con el Teorema 5.29 

p(t) = (4> Ì U)) W '(4>-At)) m * • • • (<M')) Wr 

para algunos enteros tales que 0 < m, < n, para 1 < / < r. Veremos 
más adelante que, de hecho, > 1 para cada /. 

Jeorema 6.7 0. (Teorema de la descomposición prurmria.) Sea T «n operador 
ìineal en un espacio vectorial dimensionalmente finito V <%m un polinomio 
mínimo p(t) — (</>,(t)) ,n ’ . . . (</>, (t) ) n ' r , donde </>,(t), . . . , <M0 los 
distintos factores mónicos irreducibles de p(t). Entonces 

(a) V = K*,© 

(b) Para 1 < i < r el polinomio mínimo de la restricción de T a 
K fì es (<Mt))'”*. 

demostración. La demostración la haremos por inducción sobre r. Si 
r - i, la conclusión es inmediata. Así, supóngase que el teorema ha sido 
demostrado para op>eradores con polinomios mínimos que tienen r — 1 
distintos factores mónicos irreducibles para algún entero r> 1. 

Sean g(t) = (MO) m ' y h(t) = (^(0) w ' - Entonces 

g(t) y h(t) son primos relativos. Demostraremos que V = W, © W 2 , don- 
de W, = N(g(T)) y W 2 — N(/i(T)). Como g(0 y h(t) son primos rela- 
tivos existen polinomios cf(t) y r(t) tales que cf(t)g(t) + r(t)h(t) — 1 
donde 1 es el polinomio constante. (Véase Apéndice E.) A1 sustituir T 
en la ecuación se tiene 

<7 (T )/i( T) + r(T)g(T) — I. (4) 

Entonces v= q(T)h(l)(v) + r(T)g(T)(v) para cada v(V. Pero 
g(T)q(T)h(T)(v) = q(T)h(T)g(T)(v) = q(T)p(T)(v) = q(T)T 0 (v) = 0; 

esto es, q(T)h(T ) (v) £ W,. Del mismo modo, r(T)g(T) (v) (W,. Luego 
V —■ w', + Wj. Finalmente, si n Wj, entonces por la ecuación (4) 

w — | (>v) <y(T)/i(T) (vv) t r(T)g(T)(n') - 0 r 0 — 0\ 

y así V - W, ©Wj. 
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Obsérvese que como T conmuta con g(J) y /z(T), W T y W. son T-inva- 
riantes. Sean pi(t) y p 2 (t) los polinomios mínimos de T, y T 2 , las restric- 
ciones de T a W t y W 2 , respectivamente. Ahora demostraremos que p\(t) — 
— g(t) y p>(t) — h(t). Las definiciones de W x y W 2 muestran que gíL) 
y h(J.) son ambos operadores nulos. Entonces 

Pi(t) divide a g(t) y p.(t) divide a h(t). (5) 

Entonces P\(t)p 2 (t) divide a g(t)h(t) — p(t). Pero para cualquier v£V, 
V = + w 2 para algunos vv, £ W^ y w_> £W 2 . Por lo tanto 

/h(T)/? 2 (T)(?;) = P 2 (T)Pi(T)(w : ) +/z 1 (T)p 2 (T)(w 2 ) = 0 + 0= 0. 

Luego p(t ) 9 el polinomio mínimo de T, también divide a Pi(t)p 2 (t). Como 
p(t), pi(t) y p 2 (t) son todos mónicos, se tiene que p(t) — p x (t)p 2 (t). 
Finalmente la ecuación g(t)h(t) - P\(t)p 2 (t), la ecuación (5) y el hecho 
de que los cuatro polinomios sean mónicos implica que pAt) = g(t) y 
p 2 (t) = h(t). 

Aplicando la hipótesis de inducción a T 2 y W 2 tenemos que 

W 2 - K; 2 0 • • • © K; r , donde K; t = mMTi))”")* 

y que (<t>i(t)) m ' es el polinomio mínimo de la restricción de T 2 a K^ t . Pero 
como N((<£;(T)) mi ) Ç W 2 , se tiene que 

K* = mUT)) mt ) = N((0,.(T 2 ))-) = K; t para / = 2, . . . , r. 

Además, la restricción de T a K$. es la misma que la restricción de T 2 
a K<^ t (/ = 2,. . ., r), y en consecuencia (<j>i(t)) mi es el polinomio mínimo 
de la restrioción de T a K^. Luego entonces, como 

v = Wj © w 2 ^ K„ 0 k; 2 © ... © K; r -k,@k,©...@ K, r , 

îa demostración está completa. ■ 

Principiaremos ahora el proceso de demostrar que todo operador li- 
neal T en un espacio vectorial dimensionalmente finito V tiene, sujeto a 
ciertas convenciones, una forma canónica racional única. Principiaremos 
con el caso especial en que el polinomio característico de T sea de la 
forma ±(</>(0) M , donde <j>(t) es irreducible y n es un entero positivo. 
En este caso el polinomio mínimo de T es de la forma (<f>(t) )* para algún 
entero positivo m < n y podemos demostrar que V puede descomponerse 
en una suma directa de subespacios T-cíclicos. 

Teorema 6.11 . Sea T un operador lineal en un espacio vectorial dimensional - 
mente finito V con polinomio mínimo p(t) = (<j>( t)) m , donde <j>(t) es un 
polinomio mónico irreducible y m es un entero positivo. Entonces existen 
vectores no nulos x,, x 2 , . . . , x k en V y enteros positivos n,, n 2 , ... , n K 
con n^ < m para cada i tales que 
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(a) V = C Xl © C Xï ® • • • © C Xk , donde C x . es el subespacio T-d- 
clico generado por Xj. 

(b) (<j>( t)) n$ es el 1-aniquilador de x t para i = 1, 2, . . . , k. 

demostración. La demostración se hará por inducción sobre la dimen- 
sión de V. Si dim(V) = 1, el resultado es trivial. Supóngase entonces que 
el teorema se cumple para todos los espacios vectoriales de dimensión 
menor que n , donde n > 1 es un entero, y sea dim(V) = n. 

Como el polinomio mínimo de T es p(t) — (</>(/))? n , existe un vector 
no nulo xi en V tal que (<t>(T)) m ~'(x A ) ^ 0. Y así el T-aniquilador de 
xi es p(t). Sea W = C,., y recuérdese que W es T-invariante. Sea 

T: V/W->V/W 

el operador lineal inducido por T en el espacio cociente V/W. (Véase Ejer- 
cicio 13 de la Seeción 5.4.) Se puede ver fácilmente que para cualquier 
polinomio g(t) el operador inducido por g(T) en V/W es g( T). Por lo 
tanto, si g( T) = T 0 , entonces g( T) = T 0 . Así el polinomio mínimo de T 
divide a p(t) y por lo tanto la hipótesis de inducción se aplica a T y a 
V/W. En consecuencia existen subespacios T-cíclicos C>, . . . , C k de V/W 
tales que 

V/W - C, © ... © C, 

y tales que para 2 < / < k el T-aniquilador del generador de C, es (<t>(t) ) ni 
para algún entero positivo n, < m. 

Demostraremos que para 2 < i < k existe un vector x t en el generador 
de C t tal que el T-aniquilador de x t es (<{>(t)) ni . Sea y un elemento del 
generador de Q; entonces (<t>(T)) n (y) e W = C^. Luego entonces existe 
un polinomio h(t) tal que 

(*(T )) ni (y) = h(l)( X] ). (6) 

Por el hecho de que (<j>(t) ) m es el polinomio mínimo de T, se tiene de la 
ecuación (6) que 

0= (<t>(l) ) m (y) = (<j>(l)V n - n '/i(T)U). 

Ahora bien, (</>(/) ) m es el T-aniquilador de x x . Por lo tanto (<j>(t)) m divi- 
de a (</>(/) ^'^hU) y en consecuencia (<j>(t)) Hi divide a h(t). Entonces 
(<j>(t) ) ni q(t) — h(t) para algún polinomio q(t). Defínase a x t — y — 
— <7(T)(jct). Entonces y — x t — <jr(T) (jc,) ÇÇ^ = W, y así tenemos que 
Xi se encuentra en el generador de C,. Se tiene de aquí que el T-aniqui- 
lador del generador de Q divide al T-aniquilador de x ; . Pero también, 
por la ecuación (6), 

(</>( l)) ni (x,) - (<j>d)) ni (y ~ q(D( X] )) 

= (</>(T )) n '(y) - h( T) (jc. ) = 0. 

Luego el T-aniquilador de x, es igual a (</>(/)) Mi . 


366 


Formas canónicas 


Si el grado de </>(/) es d , entonces (</>(/))"■ tiene grado Luego, 
como (</>(/) ) Mi es tanto el T-aniquilador de x, como el T-aniquilador del 
generador de C ( , el Teorema 5.27 y el Ejercicio 14 de la Secçión 5.6 mues- 
tran que 

Pi = {jTi, T(jCi), ... , T"'- 1 U,)} 

y 

y f - {jc f + W, t(x f + W),..., + W)} 

son, respectivamente, bases para C á . y C ( . Pero como V/W = C ® . . . 

• • © Q, y > U . . . U y k es una base para V/W. Se tiene entonces que 
U P'. U ... U j3 k es una base para V. Por lo tanto V = C,, © C, a © 
0...©C,,. ■ 

E1 resultado siguiente se obtiene de manera inmediata a partir del 
teorema anterior y del corolario al Teorema 6.9. 

Corolario 1. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito. Si el polinomio característico o mínimo de T es de la forma =b(</>(t) ) m 
para algún polinomio mónico irreducible </>( t ) y para algún entero positivo 
m, entonces T tiene una forma canónica racional. 

Corolario 2. Sea T un operador lineal en un espacio vectorial dimensionalmente 
finito V con polinomio característico 

f(t) = (-l)“(^ 1 (t)) n *(^(t))“» . . . (<M0) nk , 

donde <f> i(t), <f> 2 ( t), ... , <+ (t) son los distintos factores mónicos irredu - 
cibîes de f(t). Entonces, para cada i, (</>, (t)) n ’ es el polinomio caracterís- 
tico de Tj, ìa restricción de T a K+ . Por lo tanto, para cada i, K^, es 
no nuio y </>i(t) es un factor del polinomio minimo de T. 

demostración. Renumerando a </>i(/), </>-(/), . . . , </>*(/) si fuera nece- 
sario, podemos suponer que el polinomio mínimo de T es 

P(t) = (4h(t)) m '(<k(t)) m * • • • (<M0)"+ 

donde r < k y 1 < m, < n t para cada i — 1, 2, . . . , r. Sea /;(/) el poli- 
nomio característico de T,. Como de acuerdo con el teorema de descompo- 
sición primaria V — © K^, © • • • © K 0r , entonces por el Teorema 5.25 

se tiene que /(/) = /,(/) + (/) . . . f r (t ). 

Considérese cualquier /, 1 < / < r, y sea d el grado de </>;(/). Como 
el polinomio mínimo de T, es (</>,(/))"'■ en virtud del teorema de descom- 
posición primaria, podemos concluir a partir del Corolario 1 del Teorema 
6.11 que existe una base /3 para K^ ( tal que 


[T© = C x © C 2 © • • • © C f> 
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donde C, es la matriz companera de ( — 1 Y ' ,(ì (</>;(/) )' 7í para algunos ente- 
ros positivos < 7 ,, q 2 , . . . , q», Luego, si dr=q\+q-* J r ... 4- q„, tenemos 
que 

/•(/) - det(Cj - r/).det(C 2 - //).det(C, - tl) = (-1)^(0,(0)^. 

Entonces 


m=mm • • • /xo = ■ • • oMoys 

donde £ — ±1. Por lo tanto, el teorema de factorización única implica 
que r = /; y d, — n t para toda /. En particular, f\(t) — dz(</>,(0 ) /( \ 

-> {0} v <t>,(t) es un factor del polinomio mínimo de T para / - 1, 
2 /...,*/■ 

Continuando con el caso especial en que el polinomio mínimo de T 
tiene la forma (</>(/))'" para algunos polinomios mónicos irreducibles </>(/) 
de grado d, formularemos ahora un teorema de unicidad para la forma 
canónica racional de T. Con el objeto de formular este resultado adopta- 
remos de aquí en adelante la convención de que los vectores x u x>, . . . , x k 
del Teorema 6.1 1 tendrán siempre sus índices de tal modo que n x > n> > 
> . . . > n k . Sujetos a esta convención, demostraremos que los enteros 
/?,, n,, . . . , n h son únicos. De hecho, proporcionaremos un método para 
calcular estos enteros. En este momento el iector deberá observar que la 
unicidad de los enteros n t , . . . , n h implicará la unicidad de la forma 
canónica racional de T. De hecho, se tiene que la forma canónica racio- 
nal de T es 


Cl © Cl © ' * ’ © 

donde C, es ia matriz companera de ( - 1 )' 1 "' (</>(/) 

Para ayudarnos en el cálculo de los enteros n x , n >, . . . , n k en el Teo- 
rema 6.11 (y por lo tanto, estableciendo su unicidad), introduciremos un 
nuevo diagrama de puntos correspondiente a la descomposición de V como 
una suma directa de subespacios cíclicos. A diferencia de los diagramas 
de puntos de la Sección 6.2, los diagramas que ahora consideraremos no 
correspK>nden a las bases para V. Sea T un operador iineal en un espacio 
vectorial dimensionalmente finito V que tiene a (</>(/) ) w como polinomio 
mínimo para algún polinomio mónico irreducible </>(/) y algún entero 
positivo /?/. Supóngase también, al igual que en el Teorema 6.11, que 
V — C. f| © . . . © C x -. para algunos vectores no nulos x x , x„ . . ., x h en V 
y que, para cada /, x-, tiene al aniquilador (<f>(t)) n ' para algún entero 
positivo n.j . Consideremos que los índices de las x, son tales que // 5 > //, > 
> . . . > n k . El diagrama de puntos asociado con la descomposición ante- 
rior se define como el arreglo de puntos que consta de k columnas con n, 
puntos en la columna / y ordenadas de manera que la columna / principie 



368 Formas canónicas 


en la parte superior y termine después de n, puntos. Luego, si k — 3, 
n x — 4, n, — 2 y n :i — 2, el diagrama de puntos se vería como 


Si definimos a r t como el número de puntos en el renglón / del diagrama 
de puntos, vemos que los números r, quedan determinados por Ia fórmula 
dada en el Ejercicio 7 de la Sección 6.2. Además, el conocimiento de 
los números r } para toda / nos permite calcular los enteros n x , n~>, ... , n k . 

E1 siguiente teorema nos dice que los r, pueden expresarse en términos 
de los rangos de algunos operadores, de donde se deduce que los n t son 
únicos y por ello el Teorema proporciona un algoritmo para calcularlas. 

Teorema 6.1 2. Sean T y Tì como anteriormente. Entonces 

r i = -~[dim(V) — rango(<l>( T))J 

y 

r. = A-[ran g o((<t>(T) )' \) - rango((<f>(T))')] para i > I, 
donde d es el grado de <j>(t). 

demostración. A continuación se da un bosquejo de la demostración; 
el lector deberá justificar cada paso. 

Podemos establecer ambas situaciones simultáneamente adoptando la 
convención de que 

(</>(T))' - I si / — 0. 

Entonces para cualquier / > 0 

R((0(T))O = C(0(T))|(*,) @ C(^(T))<( X2 ) @ • • * @ C(0(T))‘U*), 
y por Io tanto (aplicando el Ejercicio 14 de la Sección 5.6 a <t> ì,f t (t) ) 
dim(R( (</>(T))')) = ^d^n, - /). 

n , - i 

Así para / > I, por el Ejercicio 7 de la Sección 6.2, 
rango( (<£(T))) - rango( (</>(T))') =42 (n, - (/ - I )) - 2 («, - /)] 

n , - i - l „ t • ; 

= d'2\(n, - (/ - l)) - ( n , - /)] 

= í/ 2 I = í/(max{/: n, > /}) = dr,. |j 
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Corolario 1. Los enteros n 1( n 2 , . . . , n k del Teorema 6.11 son únicos. Esto es, 
con la nolaciôn del Teorema 6.11, si existen vectores no nulos \' v \[,,. .., 
x' en V y enteros positivos n' p n'„. .., n' tales que 

V = C x ; @ C*; @ ©C,;, 

donde x'. tiene como aniquilador a (</>(t)) n para i = 1, 2,. . ., r y n' > 
> n' > ■ ■ • > n', entonces k = r, n, = n',, n 2 = n' 2 , . . ., n k = n' r . 

Corolario 2. Sea T como en el Teorema 6.11. Suponiendo que se escoge una 
base (ì para V como en el Teorema 6.9, entonces la forma canónica racio- 
nal de T, [T] ;, es única. De hecho 

m, = c, © c 2 © • • • © c k , 

donde C, es la matriz companera de ( —1 ) ni<, (</>(t) )"‘(i = 1, 2, ... , k). 

Ahora definamos la forma canónica racional de una matriz de la ma- 
nera natural. 

Definición. La forma canónica racional de AÇ M nxll (F) se define como la for- 
ma canónica racional del operador lineal L.\: F“ —> F n . 

Ejemplo 9. Considérese la matriz real A de 4 x 4 definida mediante 

/0 -1 5 -3 

1 0 0-1 

A = 

0 0 3 -2 

\0 0 5 -3 

Calcularemos la forma canónica racional de A. E1 polinomio caracte- 
rístico de A es 

l-t -15 -3 \ 

/(r) = det 1 ° = (t 2 + l) 2 . 

0 0 3 — / -2 

0 0 5 -3 - t) 

Así, en nuestra notación anterior, </>(/) = t- + 1 y d — 2. En el diagrama 
de puntos para A tenemos 

n = i[dim(R 4 ) — rango(</>(/4))] = i(4 - 0) = 2 

y 

r ; = i[rango( (</>(>4 ))'"*) - rango( (<j>(A ) ) 4 )] = i(0 - 0) = 0 
para / > 1. Luego, el diagrama de puntos para A es 
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Concluimos que n, = 1 y n. = 1. Obsérvese que el número de puntos 
en el diagrama de puntos es (l/á)dim(V). (En este caso dim(V) = 4 y 
d - 2.) Por lo tanto existen vectores x, y x 2 en R' tales que R 4 = C,, ® C r , 
y x, y x-, tienen ambas a <j>(t) = f + 1 como aniquilador. Dado que la 
matriz companera correspondiente a f + I es 



concluimos que la forma canónica racional de A es 


/0 

-1 

0 

°\ 

1 

0 

0 

0 

(T 

cT 

0~ 

’-ï 


0 

1 

0/ 


Ejemplo 10. Sea A la matriz real de 4 y 4 

/2 1 0 0\ 

_ ° 2 1 0 
0 0 2 0 • 

\0 0 0 2 / 

Nuevamente calcularemos la forma canónica racional de A. Nótese que A 
es una forma canónica de Jordan. Como veremos más adelante, la forma 
canónica racional de A difiere de su forma canónica de Jordan. Puede verse 
fácilmente que el polinomio característico j(t) de A es /(/) = (t — 2) 4 . 
Así, <j>(t) t - 2 y d 1. Ahora bien, 

r, = 4 - rango(<j>(A )) 4-2 = 2, 

r. =- rango(<j(A )) rango( (<p(A ))-) - 2 — l^ 1, 

y 

r-., — rango((<j>(A ))-) - rango( (<j>(A ))') = 1-0 1. 

Dado que hay 4 - dim(V)/r/ puntos en el diagrama de puntos, podemos 
terminar el cálculo con r 3 , y el diagrama de puntos para A es 


Concluimos que n, -- 3 y n. - I . Así tenemos que existen elementos x, 
y x -2 en R' tales que R" = C.,., ® C,,, x, tiene como aniquilador a (/ - 2) : ' y 
x. tiene como aniquilador a t - 2. Como la matriz companera de (- 
- I)"(f- 2Y 
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/0 0 8 \ 

Cj-jl 0 -12 

\o 1 6/ 


y la matriz companera de (— 1) (/ — 2) es C 2 = (2), îa forma canónica 
racional de A es 


c = c { e c 2 - 



0 

8 


1 

0 

-12 

0 

0 

1 

6 

0 

\o' 

’ò” 

0 

~2l 


Ejemplo 11. Para las matrices A y C del Ejemplo 10, encontraremos 
una matriz Q tal que Q~ X AQ — C. 

Obsérvese que A y C son similares por el corolario del Teorema 2.27. 
Por lo tanto, únicamente tenemos que encontrar una base ordenada (3 
para R 4 tal que [ l A ]p = C y luego tomar a Q como la matriz cuyas colum- 
nas son los miembros de /?. Para encontrar tal base /3 , necesitamos encon- 
trar vectores no nulos x v y x 2 en R 4 tales que x x tiene a (t — 2) 3 como 
aniquilador, x 2 tiene a (/ — 2) como aniquilador y [x u L A (^ X ), La 2 (xi), 
x«} es linealmente independiente. Para empezar, encontremos un elemento 
de R 4 con aniquilador (t — 2) 3 , esto es, un elemento x x tal que (l A “ 
— 2I) 3 (jCì) = 0 pero (l A - 21 ) 2 (jc x ) ^0 . Si consideramos metódicamente 
a los miembros de la base estándar [e u e 2 , e 3 , e 4 ), vemos que e 3 tiene esta 
propiedad. Haciendo 


Xi = e 3 


/°\ 

0 

1 

\0 


encontramos que 


L.t(JCi) = 

(o) 

1 

2 

y 

L.r(^i) = 

(l\ 

4 

4 


i°i 



i°/ 


A continuación escogemos un elemento x 2 G R 4 linealmente independiente 
de [x u L a (xi), L a =(*i)} y con aniquilador t - 2. Es evidente que e 4 satis- 
face esta condición. Así, 
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es una base para R 4 tal que [L © — C. Por lo tanto, si 


Q 


/0 0 1 0 \ 
0 14 0 
1 2 4 0’ 
\0 0 0 1 / 


entonces Q X AQ — C. 


Consideraremos ahora el caso general de un operador lineal T en un 
espacio vectorial dimensionalmente finito para el que el polinomio carac- 
terístico contiene más de un factor irreducible. Combinando los Teoremas 
6.11 y 5.26 podemos demostrar fácilmente que T tiene una forma canónica 
racional. 


Teorema 6.13 . Sea T cuaîquier operador lineal en un espacio vecîorial dimen- 
sionalmente finito V. Entonces T tiene una forma canânica racional. 

demostración. Supóngase que el polinomio característico de T es 

(-l) n (</>i(0)M<M0)^ ... (f,(0) w % 

donde m.j > 1 y los </>i(0’s son polinomios mónicos irreducibles distintos. 
Si r = 1 el resultado se sigue del Corolario 1 del Teorema 6.11. De lo 
contrario, para cada / = 1, 2, . .. , r, T <, la restricción de T a K^. tiene, 
de acuerdo con el Corolario 2 del Teorema 6.11, el polinomio característico 
±((j>i(t)) mi . Por lo tanto, de acuerdo con el Corolario 1 del Teorema 
6.11, existe una base tal que [TJp. — D t es una forma canónica ra- 
cional para T, . Haciendo /3 1= = /? L U U ... U es evidente por el Teo- 
rema 6.10 que /3 es una base para V, de modo que por el Teorema 5.26 

[T]/? — @ D 2 © • • • © D r . 

Así tenemos que [T]^ es una forma canónica racional para T. ■ 

La demostración del teorema anterior implica la selección de una 
base para V que garantice una forma canónica racional para T. Dentro del 
contexto de este resultado podemos enunciar lo siguiente: Si D = [T]^ es 
la forma canónica racional arriba construida, entonces D — D, © D, © 
0 ... 0 D r , y para cada i — 1, 2, . . . , r existe una sucesión de enteros 
n n > n i2 > • • * > n ikt > 1 tales que 

Di - C n © C í2 © • • • © C tkt9 

donde C i; - es la matriz companera de (—1 ) ntjdj (<f>t(t)) n ° y d } es el grado 
de <t>j(t). 

E1 teorema siguiente garantiza la unicidad de la forma canónica racio- 
nal de un operador, siempre que éste satisfaga la descripción anterior. 
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Teorema 6,14. Sea T un operador lineal en un espacio vectorial dimensionai - 
rnente finito V con poîinomio característico 

f(t) ----- (- l) n (Ý.(t)) mi (^(t)) mï . . . (<Mt)) n \ 

donde los </>,(t) son polinomios mónicos irreducibles distintos y m ( > 1 
para toda i. Supóngase que D es una forma canónica racional para T tal 
que D = D, @ D 2 @ • • • @ D r v para cada i - î, 2, . . . , r existe una 
sucesión de enteros n h > n i2 > • • ■ > n ik| > 1 tales que D, =- C M © C ri © 
® . . . ® C ik . donde C É j es la matriz companera de (—l) n,id, (0i(t)) nij y dj 
es el grado de </>, (t). Entonces D es única en eí sentido de que si D' cs 
cualquier otra forma canónica racional para T que satisfaga la descripción 
anterior para sucesiones de enteros > n[ 2 > • • • > n' ikl > 1, entonces 
D - D'. 

demostración. Dado D = D x © D 2 ® • • • ® D r , sea f3 una base para 
V tal que [T]^ - D. Supóngase para cada / 1, 2, . . . , r que D, es una 

matriz de p t x P\. Sean f3 } el conjunto ordenado consistente de los prime- 
ros /;, miembros de /?, /3- 2 el conjunto ordenado formado por los siguientes 
p 2 miembros de [3 , y así sucesivamente. Para cada / - - 1, 2, . . . , r defínase 
W, como el subespacio generado por f3,. En virtud del hecho de que D 
es una suma directa de las D,, W, es un subespacio T-invariante de V y 
[T W J^ = D { . Como el polinomio característico de D, es un producto de 
polinomios característicos de las matrices companeras C;,, D, debe tener 
un polinomio característico =± (</>;(/) ) Wf . Por lo tanto también lo debe 
tener T Wl . Así, por el teorema de Cayley-HamiJton, (c/>,(T )) Mi (x) : 0 
para toda x£W,, de manera que W, C K</> ( y por lo tanto 

dim(W,) < dimílC^) para / — 1, 2,. . ., r. (7) 

Como 

P = Ú Pi y PiCì pj= 0 para i 

i - 1 

tenemos que V = Wj ® W 2 ® • • • © W r . Por lo tanto 

dim(V) — 2dim(W,). (8) 

« i 

Pero por el teorema de descomposición primaria tenemos también que 

dim(V) -- V dim(K^ ( ). (9) 

i i 

Luego, por Ias ecuaciones (7), (8) y (9), concluimos que dim(W,) ~ 
dim(K</, t ) para toda /. Así W, — K^. para cada / y por lo tanto (3, 
es una base para K(/ - 1, 2,. . ., r). De aquí que 


Di - [T ( Ij^ 
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es< una forma canónica racional para T,, la restricción de T a K^. Pero, 
de acuerdo con el Corolario 2 del Teorema 6.12, D* es única y se tiene 
la unicidad de D = D x © D 2 © • - • © D r . ■ 


Ejemplo 12. Eneontraremos la forma canónica racional de la matriz 
real 


A = 


0 2 0 -6 2 \ 
1-2 0 0 2 
1 01 - 32 . 

1 - 21-12 
1-4 3-3 4 


Si f(t) es el polinomio característico de A, entonces puede demostrarse 
que /(0 - -(f- + 2y-(t-2). 

Así, 0i (0 — f 4- 2 y 02 (0 — t — 2 son los distintos factores mónicos 
irreducibles de f(t ). Sean T = L t y T* îa restricción de T a K^. Entonces 
îos polinomios característicos respectivos de T t y T 2 son, por el Corola- 
rio 2 del Teorema 6.11 (f + 2) 2 y — (t — 2), respectivamente. Por tanto 
dimí^) - 4 y dim(K^ 2 ) — 1. Como la forma canónica racional de T 
es la suma directa de las formas canónicas racionales de T, y T 2 , es nece- 
sario calcular cada una de éstas. 

Para encontrar la forma canónica racional de T 3 , debemos aplicar el 
Teorema 6.12 a T x . Pero de acuerdo con el Ejercicio 13 podemos, en vez 
de ello, aplicar el Teorema 6.12 directamente a T: R 5 —> R 5 . Primero, sin 
embargo, obsérvese que el número de puntos en el diagrama de puntos 
para L es (l/^)dim(K^) = i(4) = 2, donde d es el grado de 0i (t). 
Denotando por r x al número de puntos en el primer renglón del diagrama 
de puntos para T,, el Ejercicio 13 nos muestra que 


r, = i[dim(R 5 ) - rango(0i(T))] 

= *[5 - rango (A* + 2/)] 

0 o\ 

12 6 

12 6= i(5 - 1) = 2. 

12 6 
24 12/ 

Tenemos entonces que el primer renglón contiene todos los puntos del dia- 
grama de puntos para T,; esto es, el diagrama de puntos para T t es 


/o 0 0 

0 0 6 - 

= i 5 - rango 0 0 6 — 

0 0 6 - 

\0 0 \2 - 


Concluimos que n r = = 1. Así, si D, es la forma canónica racional de 

Ti, entonces 

D x — Cn ® C,2, 
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donde 


Por lo tanto 


c„ 

n 

1 

o) 


-2 

j 0 

°ì 

1 

0 

i 0 

1 

0 

o" 

0 

j'o" 

'-2 


0 

1 

ol 


La situación para ï 2 es trivial. Como dim(K^ a ) = 1, el diagrama de 
puntos contiene únicamente un punto. Así si D 2 es la forma canónica 
racional para T 2 , entonces D 2 = (2) y la forma canónica racional de 
A es 




1° - 

-2 

0 

0 

°) 




L_ 

0 

0 

0 

0 


D= D t @D 2 

= 

0 

0 

0 

-2 

0 

. 



0 

0 

1 

0 

-°l 




lo 

0 

0 

0 

2/ 


E1 lector deberá darse cuenta 

de 

que 

si 

hubiéramos 

escrito f(t) = — 

— (/ — 2) (t 2 + 2) 2 y hecho a 

h 

(0 = 

: - 

(t 

- 2) 

y 

a &>(/) = t 2 + 2, 


entonces nuestro cálculo de la forma canónica racional de A hubiera dado 



0 

0 

0 

0\ 

o' 

0 

-2 

0 

0 

0 

1 

0 

0 

0 

0 

'ò'" 

0 

"o” 

—2 


0 

0 

1 

0/ 


Cualquiera de las formas de D es aceptable. Nótese que, excepto por la 
permutación de «/>,(r) y </>l>(0> D es única. 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) La forma canónica racional de un operador lineal es la suma directa 
de matrices compaiieras. 

(b) Si T es un operador lineal en un espacio vectorial dimensionalmente 
finito V y /3 es una base para V tal que [T]^ sea la suma directa de 
matrices compaiieras, entonces [T]^ es una forma canónica racional 
para T. 
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(c) Existen matrices cuadradas que no tienen forma canónica racional. 

(d) Una matriz cuadrada es similar a su forma canónica racional. 

(e) La forma canónica de Jordan y la forma canónica racional de cual- 
quier operador lineal son las mismas. 

(f) Para cualquier operador lineal T en un espacio vectorial dimensio- 
nalmente finito V, cualquier factor irreducible del polinomio caracte- 
rístico de T divide al polinomio mínimo de T. 

(g) Sea </>(/) un divisor mónico irreducible del polinomio característico de 
un operador lineal T. Los puntos del diagrama de puntos utilizado para 
calcular la forma canónica racional de T K corresponden uno-a-uno 
con los vectores de una base para K^. 


2. Para cada una de las siguientes matrices encontrar la forma canónica ra- 
cional. 

(a) La matriz real 


(b) La matriz real 


í 3 1 

A= 0 3 

\0 0 


3. 


-(? :!) 

(c) La matriz compleja 

-(? :í) 

(d) I.a matriz real 

/0 -7 14 — 6\ 

= 1 -4 6-3 

_ 0 -4 9-4 

\0 -4 11 -5/ 

(e) La matriz real 

/0 -4 12 — 7\ 

, 1-1 3-3 

A = 

0-1 6-4 

\q -1 8 -51 


Demostrar que si T es un operador lineal en un espacio vectorial dimensio- 
nalmente finito V de polinomio mínimo (</>(0)"' para algún entero positivo 
m, entonces N( (</>(T))”' ') es un subespacio T-invariante propio de V. 


4. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V 
de polinomio característico /(/) -- ( 1 )"(^,(0)"'•(<>,(/))'"= . . . (</>,(/))"'', 



Forma canónica racional 377 


donde los </>ì(0’s son polinomios mónicos distintos irreducibles, mi es un 
entero positivo para cada / y n = dim(V). Demostrar que para cualquier 
l = 1, 2, . . . , r, si d t es el grado de entonces dim(K$, ( ) — m{di. 

5 Sea T como en el Ejercicio 4. Considérese cualesquiera / y / tales que / ^ /'. 
Demostrar que la restricción de <MT) a K* ( es uno-a-uno y sobreyectiva. 

6 Sea T un operador lineal en un espacio vectorial dimensionalmente fimto V 
de polinomio mínimo (</>(/) ) m para algún polinomio mónico irreducible 

y para algún entero positivo m. Demostrar que la restricción deTaR(</>( )) 
tiene como polinomio mínimo a (</>( 

7. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demostrar que la forma canónica racional de T es una matriz diagonal si 
y sólo si T es diagonalizable. 

8 Sea T un operador lineal en un espacio vectorial dimensionalmente fimto V 
de polinomio característico /(/) = (— 1 )”</»,(0</>,(0, donde fc(0 y <h(0 
son polinomios mónicos irreducibles distintos y n = dim(V). 

(a) Demostrar que existen elementos x, y x-, en V tales que tiene 
como T-aniquilador a </>,(/), tiene como T-aniquilador a <f> 2 (t) y 

V — C Xl ® C Xi . 

(b) Demostrar que existe un elemento x* en V con T-aniquilador <£i(0<#» 2 (0 
para el que V — C Xl . 

Así, para asegurarnos que la descomposición de V en una suma directa 
de subespacios cíclicos es única, debemos exigir que los generadores de los 
subespacios cíclicos en la suma tengan las potencias de los factores monicos 
irreducibles del polinomio característico iguales a las de sus T-aniquiladores. 

9. En la notación del Teorema 6.11, demostrar que los ìndices de las Xi son 
tales que n x > n± > ... ^ entonces n Y — m. 

10. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Suponiendo que la notación es la misma del enunciado del Teorema 6.14, 
demostrar que el polinomio mínimo de T es 

p(t) = (</>,(/) r"(<j>2(0) n '-' ••• (4>r(t)) nrì - 

11. Sea T un operador lineal en un espacio vectorial dimensionalmente finito V. 
Demostrar que para cualquier polinomio irreducible <j>(t), si <j>(J) no es 
uno-a-uno en V, entonces </>(/) divide al polinomio característico de T. 
Sugerencia: Utilizar el Ejercicio 14 de la Sección 5.6. 

12. Justificar la siguiente observación hecha en el Ejemplo 9: Si T es un opera- 
dor lineal en un espacio vectorial dimensionalmente finito V de polinomio 
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mínimo (</>(/))"', donde es irreducible, mónico y de grado d, entonces 
el número de puntos del diagrama de puntos para T es dim(V)/ í/. 

13, Justificar la aplicación del Teorema 6.12 en el Ejemplo 12; esto es, demos- 
trar el siguiente resultado: Sea T un operador lineal en un espacio vectorial 
dimensionalmente finito V de polinomio característico 

f(t) = (-l) n (<t> 1 (0) m '(<t>2(t)) m -- ... (<M0)’"% 

donde los </>,(/) son los distintos factores mónicos irreducibles de /(/), /n, 
es un entero positivo (/ = 1, 2, . .. , r) y n — dim(V). Entonces para cual- 
quier / = 1 , 2, . . . , r 

dim(V) - rango (0,(T)) = dim(KJ - rango (0(Tk*)), 
y para cualquier entero j > 1 


rango ((<f>,(T)) J ~') - rango ((<f>,(T)) J ) = rango ((^,(Tk a )) ; “ 1 ) - rango ((0,(T K#1 ))O. 

Luego si r,- es el número de elementos del renglón j del diagrama de puntos 
para Ï K ^ entonces 

r i = -jtdim(V) - rango(<£;(T))], 


—[rango((</>i(T))^ 


l ) ~ rango((^(T))0] para j> 1, 


en donde d es el grado de <£i(/). 
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Capítulo "7 


Espacios con producto 
interior 


Muchas de las aplicaciones de las matemáticas están involucradas con el 
concepto de medición y, por lo tanto, con el de magnitud o tamano rela- 
tivo de diversas cantidades. Luego, no es sorprendente de que los campos 
de los números reales y los complejos que contienen una noción intrínse- 
ca de distancia jueguen un papel especial. En este capítulo, considerare- 
mos que todos nuestros espacios vectoriales se encuentran sobre el campo 
F , donde F representa a R o a C. 

Introduciremos la idea de distancia o longitud en los espacios vecto- 
riales obteniendo una estructura mucho más rica, la famosa “estructura 
de espacio con producto interior”. Esta estructura adicional proporcionará 
aplicaciones a îa geometría (Sección 7.8), a la física (Sección 7.4), condi- 
cionamiento en los sistemas de ecuaciones (Sección 7.6), aplicaciones a 
los mínimos cuadrados (Sección 7.10) y formas cuadráticas (Sección 
7.11). 


7.1 PRODUCTOS INTERIORES Y NORMAS 

Muchas de las nociones geométricas tales como ángulo, longitud y perpen- 
dicularidad en R 2 y R 3 pueden extenderse a espacios vectoriales reales y 
complejos más generales. Todas estas ideas están relacionadas con el con- 
cepto de “producto interior”. 

Definiciórt. Sea V un espacio vecîorial sobre F. Un producto interior en V es 
una función que asigna a cada par ordenado de vectores x y y en V un esca- 
lar en F, representado como (x, y), tal que para toda x, v y z en V y toda 
c en F se tiene que: 

(a) (x + z, y) = (x, y) + (z, y). 

(b) (cx, y) = c(x, y). 

(c) (x, y) = (y, x), donde la barra indica conjugación compleja . 

(d) (x, x) > 0 si x 0. 



380 Espacios con producfo interior 


Nótese que (c) se reduce a (x, y) — (.y, x) si F = R. Las condiciones 
(a) y (b) simplemente requieren que el producto interior sea lineal en la 
primera componente. 

Se puede comprobar fácilmente que si a u ... , a n y y, jc,, x 2 , ... , 
x n C V, entonces 

( 2 aiX„ y) = 2 «i (jr,, y ). 

\i t / t=l 

Ejemplo 1. V — F n . Para jc = (a J? . . . , a /} ) y y — (b x , . . . , ò w ) de- 
fínase 

n _ 

(-ï, >0 = 2 a,b 

i = 1 

(., .) satisface las condiciones de la (a) a la (d) y se denomina producto 
interior ordinario en F n . (En cursos elementales de álgebra lineal, éste se 
denomina producto punto.) 

La verificación de (a) hasta (d) es sencilla. Por ejemplo, si z — (c u . . ., 
c„), tenemos para (a) 

(x + z, y) = 2 (ai + c05i — 2 + 2 ciïï 

i - l i - l i 1 

= (■*, y) + (z, y)- 

Así para x = (1 + /, 4) y y = (2 — 3/, 4 + 5/) en C 2 tenemos que 

(x, y) = (1 + 0(2 + 3/) + 4(4 - 5 i) = 15 - 15/. 

Ejemplo 2. Si (x, y) es un producto interior cualquiera en un espacio 
vectorial V y r > 0, podemos definir otro producto interior mediante la 
regla (x, y) f ~ r(x, y). Si se tuviera que r< 0 entonces (d) no se 
satisfaría. 

Ejemplo 3. Sea V C([0, 1]) el espacio vectorial de funciones continuas 

r 1 

de valor real en [0, I]. Para /, gCV, defínase (/, g) = f(t)g(t)dt. Como 

Jo 

la integral anterior es lineal en /, (a) y (b) son inmediatas y (c) es trivial. 
Si / 0, entonces la gráfica de /- está ubicada sobre el eje x en algún 

subintervalo de [0, 1] (aquí se utiliza la continuidad), y por lo tanto 

(/,/) = \\mydt> o. 

Definición . Sea A una matriz de m x n con elementos de F. Dejinimos la 
transpuesta conjugada (o adjunta) de A como la matriz A* de n x m tal 
que (A*)jj « Ajì. 

Ejempio 4. Sea 


A := (‘ 1 + 2Ì \ 

A \2 3 + 4+ 
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Entonces 


G 3 - 4 /)- 

La transpuesta conjugada de una matriz jugará un papel muy impor- 
tante en el resto de este capítulo. Nótese que si A tiene elementos reales, 
entonces A* es sencillamente la transpuesta de A. 

Ejemplo 5. Sea V =- M I1X11 (F) y defínase (A , B) --tr(flM) para A, 
B ÇV. (Recuérdese que la traza de una matriz A se define también como 

n 

tr {A) = 2 A Verificaremos que los incisos (a) y (d) de Ia definición 

i : 1 

de producto interior se satisfacen y dejaremos los incisos (b) y (c) al 
lector. Para ello, sea A, B, CÇV. Entonces (utilizando el Ejercicio 6 de 
la Sección 1.3) (A t- B, C) = tr (C*(A + B)) = tr (C*A + C*B) = 
= tr (C*A) + tr (C*B) = (A, C) + (B, C). También 


(A, A) =tr (A*A) = 2 (A*A) n = 2 2 

i - 1 i 1 1 

n n _ n n 

= 2 2 AuiA k , = 22! A ki I*. 

i -1 fc -1 i 1 /t 1 

Por lo tanto, si /1 -/= 0,entonces/ÍA, •/■ 0 para algunas k e /. Así (A, A) >0. 

Un espacio vectorial V sobre F dotado con un producto interior espe- 
cífico se llama espacio con producîo interior. Si F C, llamamos a V‘ 
espacio complejo con producto interior , mientras que si F - R, llamamos 
a V espacio real con producto interior. 

Así, los Ejemplos 1, 3 y 5 también proporcionan ejemplos de espacios 
con producto interior. Fara eï resto de este capítulo , F n sercí el espacio con 
producto interior con el producto interior dado en el Ejemplo 7. 

E1 lector deberá tener la precaución de que dos distintos productos inte- 
riores en un espacio vectorial dado, arrojan dos distintos espacios del 
producto interior. 

Un espacio del producto interior muy importante que se parece a 
C([0, 1]) es el espacio H de funciones continuas de valor complejo defini- 
das en el intervalo [0, 2-] con el producto interior 

(/, g) - 2-_ jT í(t)JU)dt. 

La razón de la constante será evidente posteriormente. Este espacio 

del producto interior, que surge a menudo dentro del contexto de situa- 
ciones de tipo físico, será examinado más detenidamente en secciones pos- 
teriores. 
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En este momento mencionaremos algunas cuestiones sobre la integra- 
ción de funciones de valor complejo. Primero, el número imaginario / 
puede ser considerado como una constante bajo el signo de integración. 
Segundo, toda función de valor complejo f puede escribirsé como / = f x + 
+ // 2 , donde f x y f 2 son funciones de valor real. 

Entonces tenemos que 

f ,= f u+i f<‘ * T ,= f i 

De estas propiedades, así como de la suposición de continuidad, se 
tiene que H es un espacio con producto interior. 

Algunas propiedades que se derivan de inmediato de la definición de 
un producto interior están contenidas en el siguiente teorema. 

Teorema 7.1 . Sea V un espacio con producto interior . Entonces para x, y, z£V 

y c£F 

(a) (x, y + z) = (x, y) + (x, z). 

(b) (x, cy) = c(x, y). 

(c) (x, x) = 0 si y sólo si x = 0. 

(d) Si (x, y) = (x, z) para toda xÇV, entonces y = z. 

DEMOSTRACIÓN. 

(a) (*, y + z) = (y + z, x) = (y, x) + (z, x) 

= (y , x) + (zTx) = ( x , y) + (jt, z). 

Las demostraciones de (b), (c) y (d) se dejan como ejercicios. ■ 

E1 lector deberá observar que los incisos (a) y (b) del Teorema 7.1 
muestran que el producto interior es lineal conjiigado en la segunda com- 
ponente. 

Con el objeto de generalizar la noción de longitud en R 3 para espacios 
con producto interior cualesquiera, necesitamos observar únicamente que 
la longitud de x = ( a , b , c) Ç R 3 está dada por V a- + b- + c 2 = V ( x , jc) . 
Por lo tanto, damos la siguiente definición. 

Definición. Sea V un espacio con producto interior. Para xÇV definimos la 
norma (o longitud) de x mediante || x j| = V (x, x). 

Ejemplo 6. Sea V = F n . Entonces 

n “I V4 

?i 11 J 

es la definición Euclidiana de longitud. Nótese que si n = 1, tenemos que 
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Como sería de esperarse, las conocidas propiedades de la longitud en 
R 3 se satisfacen en general, como se demostrará más adelante. 

Teorema 7.2. Sea V urt espacio con producío interior. Entonces para toda x, 
y ÇV y cÇF tenemos 

(a) ||«|| = |c|;||x||. 

(t>) ||x|| — 0 si y sálo si x = Q. En cualquier caso ||x|| > 0. 

(c) (Desigualdad de Cauchy-Schwarz) |(x, y)| < ||x|| • ||y||. 

(d) (Desigualdad del triángulo) ||x + y|| < ||x|| + ||y||. 

demostración. Dejaremos la demostración de (a) y (b) como ejerci- 
cios. 

(c) Si y — 0, entonces el resultado es inmediato. Así, supóngase que 
y 0- Entonces, para cualquier c£F , tenemos que 

0 < II* - cy|| 2 = (x- cy,x- cy ) = (*, * - cy) - c(y, x - cy) 

= (*, *) — c(x, y) — c(y, *) + cc(y, y). 

Haciendo 


„ _ (*, y) 
(y, y) ’ 


la desigualdad anterior será 

0 < (x, x) - + - ’- y)|2 = ||*|| 2 

(y, y) 1 11 

de donde se obtiene (c). 


\(x, y)\- 

IMI 2 ' 


(d) II* + Jll 2 = (X + y, x + y) = (x, x) + (y, x) + (*, y) + (y, ý) 

= ||*||* + 2Re(af,^) + ||j;||* 

^ ||*||*+ 2|(jf,j;)| + || j ;||* 

<||*|| 2 + 2 ||*||.||>>|| + | b || 2 

= (11*11 + \\y II) 2 , 

donde Re(*, ;y) es Ia parte real del número complejo (*, y). Nótese que 
utilizamos al inciso (c) para demostrar (d). ■ 


E1 caso en que se da la igualdad en (c) y (d) se considera en el 
Ejercicio 15. 


Ejemplo 7. Para V = F n podemos emplear (c) y (d) en el producto inte- 
rior ordinario para obtener Ias siguientes muy conocidas desigualdades 
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y 


< Ì|«i|*J'+[_2N 2 Vï - 

E1 lector podrá recordar de cursos anteriores que para V — R 3 o R 2 
tenemos que (*, 3 ;) = [|jr|| • }!y[|cos 0 donde 0 es el ángulo ( 0 <0 < 7 r) 
entre x e y. Esta ecuación implica a (c) de un modo inmediato puesto 
que |cos 0\ < 1. Nótese igualmente que x e y son perpendiculares si y sólo 
si cos 0 — 0 , esto es, si y sólo si (x, y) --- 0 . 

Estamos en el momento de poder generalizar la noción de perpendicu- 
laridad para espacios con producto interior cualesquiera. 

Definiciones. Sea V un espacio con producio iníerior. Un vector x en V es un 
vector unitario si ||x[| "■ 1. Los vectores x y y son ortogonales (perpen- 
diculares) si (x, y) - 0. Un subconjunto S de V es ortogonal si cualquier 
par de elementos distintos de S es ortogonal. Finalmente un subconjunto 
S de V es ortonormal si S es ortogonal v está formado únicamente de 
vectores unitarios. 


2 \ai + b ,| 2 

_ i 1 _ 


Nótese que si S : {*„ x., . . . , x„), entonces S es ortonormal si y 
sólo si (jf/, Xj ) 8 ;/, donde 8 ;; es Ia delta de Kronecker. Obsérvese tam- 
bién que para cualquier vector no nulo jc, (l/![jr[|)jr es un vector unitario. 


Ejemplo 8. E1 conjunto S {(1, 1), ( 1 , —1)} en F- es ortogonal pero 
no ortonormal; sin embargo 


S = 



es ortonormal. 


Ejemplo 9. Recuérdese a H (ver Ia pág. 381). Proporcionaremos un 
ejemplo muy importante de un subconjunto ortonormal de H al cual regre- 
saremos en ejemplos posteriores. Defínase a S — {e ijr : j es un entero), 
donde / es el número imaginario V ~ 1 • Claramente S es un subconjunto 
de H. (Recuérdese que e ijr — cos jx + / sen jx.) Utilizando la propie- 
dad de que e l ' - e ,( para cualquier número real /, tenemos para i¥=k 
que 


(e iJ \ e ikx ) 



e iJ, e ik ' dt 



e iiJ ~ k " dt 


_ \ 

2 ni(j 


k) 


0 


0 . 
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Híîibién tenemos que 


otras palabras ( e' jr , e ikT ) — 8// 4 . 

| Si consideramos a los espacios R 2 y R :; , es geométricamente evidente que 

Ì | conjuntos ortogonales de vectores no nulos son linealmente indepen- 
|ntes. E1 teorema siguiente nos dice que esto es cierto en cualquier espacio 
pi producto interior. 

| 7.3. Sea V un espacio con producto interior, y sea S un conjunto orto- 
j ial jormado por vectores no nulos. Entonces S es lineahnente indepen- 

mostración. Sean jc, , ... , x„ elementos distintos en S y supóngase 


0 V a,Xi. 


tonces para cualquier /, l < j < n 9 

f 0 - (0, xj ) - ( 2 a,x n xj\ — 2 cii(Xi, Xj) *-= ctj | \Xj jj“ 


|||;sto que (Xi, Xj) ~ 0 para i / j. Como x } /= 0, tenemos que = 0. 
;|r lo tanto, S es linealmente independiente. ■ 

|i 

' Este teorema nos dice, por ejemplo, que el espacio vectorial H del Ejem- 
l!p| 9 contiene un conjunto independiente infinito y por Io tanto no es un 
Éllacio vectoriai dimensionalmente finito. 


r si las siguientes afirmaciones son verdaderas o falsas. 

Un producto interior es una función de valor escalar dentro del con- 
junto de pares ordenados de vectores. 
i Un espacio con producto interior debe estar sobre el campo de los 
números reales o complejos. 

Un producto interior es lineal en ambas componentes. 

Existe exactamente un producto interior en el espacio vectorial R n . 

La desigualdad del triángulo sólo se cumple para espacios con pro- 
. ducto interior dimensionalmente finitos. 

Todo conjunto ortogonal es linealmente independiente. 
s Todo conjunto ortonormal es linealmente independiente. 
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(h) Unicamente las matrices cuadradas tienen una transpuesta conjugada. 

(i) Si (x, y) — 0 para toda x en un espacio con producto interior, enton- 
ces v = 0. 

2. Sea V — C ;{ con el producto interior ordinario. Sean x — (2, 1 f- /, /) y 
y ~ ( 2 ~ /, 2, 1 + 2/). Calcular (x, y), ||jt||, ||yj| y ||jr -f y|i 2 . Luego veri- 
ficar tanto la desigualdad de Cauchy como la del triánguío. 

3. En C([0, 1]) sea /(/) t y g(t) — e 1 . Calcular (/, g) (tal como se definió 
en el Ejemplo 3), |j/||, |jgj| y jj/ + g\\. Luego verificar la desigualdad de 
Cauchy y la del triángulo. 

4. Sea V — M nxll (F) con (A, B) = tr(B*A). Completar la demostración del 
Ejemplo 5 de que (., .) es un producto interior. Si n -- 2 y 



calcular \ ] A |j, \\B\\ y ( A , B). 

5. Demostrar que (x, y) x/íy* es un producto interior en C 2 , donde 



Calcular (x, y) para x - (1 - i, 2 + 3/) y y = (2 4- /, 3 2/). 

6 . Completar la demostración del Teorema 7.1. 

7. Completar la demostración del Teorema 7.2. 

8. Dar razones por las cuales cada uno de los siguientes incisos no son pro- 
ductos interiores en los espacios vectoriales dados. 

(a) (( a , b), (c, d)) — ac — bd en R- 

(b) (A, B) - tr (A 4- B) en M 2x ,(R) 

( c ) (f,g)= í f'(t)g(t)dt en P(R), donde ' denota diferenciación. 

J 0 

9 . Sea p una base para un espacio con producto interior dimensionalmente fi- 
nito. Demostrar que si (x, y) — 0 para toda x£p, entonces y — 0. 

10 . * Sea V un espacio con producto interior, supóngase que x y y son elementos 

ortogonales de V. Demostrar que \\x + y||-' = ||*||- + Deducir el teo- 
rema de Pitágoras para R 2 . 

11. Demostrar la ley del paralelogramo en un espacio con producto interior V; 
esto es, demostrar que 

ll^ + .Hl 2 + \\x - y || 2 = 2j| jc|| 2 + 2||.y|| 2 para toda x, y£V. 
i,Qué expresa esta ecuación con respecto a paralelogramos en R-? 
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12 .* Sea {x u . . . , x k } un conjunto ortogonal en V y sean a ly . . . , Ok Ç.F. De- 
mostrar que 


2 GìXì 


- 2 ki| 2 |ki| 


13. Supóngase que (., .>! y (., .) 2 son dos productos interiores en un espacio 
vectorial V. Demostrar que (., .) = (., .) a + (., .) 2 es otro producto inte- 
rior en V. 


14 . Sean A y B matrices de n x y sea c£F. Demostrar que (A + cfí)* = 
= ,4*+7£*. 


15 . (a) 


Demostrar que si V es in espacio con producto interior, entonces 
|(jc, y)\ — ||jc|| * ||y|| si y 51o si uno de los vectores jc o y es múltiplo 
del otro. Sugerencia: Si 'j 0, sea 


a — 



Entonces x = ay + z, donde (y, z) = 0. Por suposición 


Aplicar el Ejercicio 10 a ||jc || 2 = \\ay + z|| 2 y obténgase |[z|| = 0. 

(b) Obtener un resultado semejante para la igualdad \\x + y|| = \\x\\ + 
+ ||y|| y generalizarla para el caso de n vectores. 


16. Sea V = C([0, 1]), y defínase 

(f, g ) = £‘f(i)g(t)dt. 
^Es éste un producto interior sobre V? 


17. Sea V un espacio con producto interior, y supóngase que T: V V es 
lineal y que | |T (jc) | [ = |[jc|) para toda jc. Demostrar que T es uno-a-uno. 

18. Sea V un espacio vectorial sobre F, donde F = R o C, y sea W un espacio 
con producto interior sobre F con un producto interior (.,.). Si T: V W 
es lineal, demostrar que (jc, y)' = (T(^), T(y)) define un producto interior 
en V si y sólo si T es uno-a-uno. 


19. Sea V un espacio con producto interior; demostrar que 

(a) | |jc z±z y[[ 2 ~ [ [jcj | 2 =±= 2 Re(jc, y) + |ly|[ 2 para toda x, y€V, donde 
Re(jt, y) es la parte real del número complejo (x, y). 

(b) |||x|| - Iblll < ||x - y\\ para toda x, yÇV. 
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20. Sea V un espacio sobre F con producto interior. Verificar las ideníidades 
poiares. Para toda x, yÇV 

(a) (x 9 y) -- i\\x -f >>!!'-’ - ìWx - v!l 2 si F - R. 

(b) (*, y) — i 2 i k \\x + f>!! 2 si F — C. 

/v -1 _ 

Donde / * - V — 1 

21 . Sea A una matriz de n x n. Defínase 

v4i = -^(A -f A*) y /4, = -L (/4 - /4*). 

(a) Demostrar que A* = /4 p /4* — /í y ^4 = /4 a d- //4o. ^Sería razona- 

ble definir a A x y A , como las partes real e imaginaria, respectiva- 

mente, de la matriz A? 

(b) Sea A una matriz de n x n. Demostrar que si A ~ B x + iB> donde 

£* = B y y B * = B n entonces B L = Ai y B 2 - A 2 . 

22. Sea V un espacio vectorial sobre F, donde F es R o C. Sea o no V un 

espacio con producto interior, podemos aún definir una “norma” ||*[! como 
una función de valor real en V que satisface las siguientes condiciones para 
toda x, y Ç_ V y aÇ_F. 

(i) ||jt|| > 0 y [|jc[| = 0 si y sólo si x = 0. 

(ìì) ||a*|| = W • IW|. 

(iii) \\x + y\\ < |WÌ + \\y\\. 

Demostrar que las siguientes son normas en los espacios vectoriales da- 


dos 

V. 







(a) 

V - 

= M mxn (F); 

IMII 

= max \A,j\ 

i,j 

para 

toda 

A ÇV 

(b) 

V - 

= C([0. 1]); 

ll/ll 

= max |/(/)| 

f£[0.1] 

para 

toda 

/€V 

(c) 

V - 

= C([0. 1]); 

ll/ll 

= \'\m\dt 

para 

toda 

/€ v 

(d) 

V = 

= R 2 ; II (fl. 

Z>)|| = 

max (|a|, |6|} 

para 

toda 

( a , 6) en V 


Utilizar al Ejercicio 20 para demostrar que no hay ningún producto inte- 
rior (., .) en R 2 tal que ||jf || 2 = (jc, jc) para toda jcÇR 2 si (., .) se define 
como el inciso (d). 


23. Sea V un espacio con producto interior y defínase para cada par ordenado 
de vectores el escalar d(x, y) — ||jc — y|| llamado la distancia entre x e v. 
Demostrar, para toda x, y, zÇ. V, que 


(a) d(x, y) > 0. 

(b) d(x, y) i= d(y, x). 
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(c) d(x , y) < d(x , z) + d(z , y). 

(d) J(x, jc) — 0. 

(e) d(x, y) 0 si x =+ y. 

24. Sea V un espacio vectorial real o complejo (posiblemente dimensionalmente 
infinito), y sea /3 una base para V. Para x, y £ V existen ... , x„ £/? tales 
que 

î» « 
x - 2 y y = 2 

i-1 î=i 

Defínase 


(•ï, y) = 2 flií»;- 

i ~ 1 

Demostrar que (., .) es un producto interior en V. Así pues, todo espacio 
vectorial real o complejo puede ser considerado como un espacio con pro- 
ducto interior. 

Demostrar que si V = R n o C n y f3 es la base ordenada estándar, enton- 
ces el producto interior definido anteriormente es el producto interior 
ordinario. 


7.2 EL PROCESO DE ORTOGONALIZACION DE GRAM-SCHMIDT 
Y COMPLEMENTOS ORTOGONALES 

En capítulos anteriores vimos el papel especial que las bases ordenadas 
estándar juegan en R n . Las propiedades de estas bases se derivan del hecho 
de que los vectores de la base forman un conjunto ortonormal. Así como 
las bases son Ios “tabiques” con los que se construyen los espacios vecto- 
riales, las bases que son también conjuntos ortonormales son los ‘ k tabiques ,, 
de los espacios con producto interior. Ahora daremos nombre a estas 
bases. 

Definición. Sea V un espacio con producto interior. Un subconjunto (3 de V es 
una base ortonormal para V si f3 es una base ordenada ortonormal. 

Ejemplo 10. Si V — F", entonces la base ordenada estándar es una base 
ortonormal para V. 

Ejemplo 11. 



es una base ortonormal para R-. 
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Por supuesto, aún no hemos demostrado que todo espacio del producto 
interior dimensionalmente finito posee una base ortonormal. E1 siguiente 
teorema nos lleva la mayor parte del camino para la obtención de este 
resultado. Nos dice cómo construir un conjunto ortogonal a partir de un 
conjunto linealmente independiente de vectores, de tal modo que ambos 
conjuntos generan el mismo subespacio. 

Antes de enunciar este teorema consideremos un caso sencillo. Supón- 
gase que {y u y 2 } es un subconjunto linealmente independiente de un 
espacio con producto interior (y, por lo tanto, una base para algún sub- 
espacio bidimensional). Nos gustaría construir un conjunto ortogonal a 
partir de {y u y 2 } que genere al mismo subespacio. La figura 7.1 siguiente 
sugiere que el conjunto (jc a , * 2 } donde jc t — y t y x> = y 2 — cy v darán 
resultado si se escoge adecuadamente a c. 



figura 7.1 


Para encontrar a c necesitamos únicamente resolver la ecuación siguiente. 

0 = ( x 2 , yj = (y 2 - cy u y t ) = (y 2 , y t ) ~ c(y u y t ) 

Luego 


c — 


Y entonces 


(y 2 , yi) 

l|y<ll 2 ' - ' 

(yz, yi ) 

IWI 2 


r-y i- 


Este proceso puede extenderse a cualquier subconjunto finito linealmente 
independiente. 


Teorema 7.4. Sea V un espacio con producto interior, y sea S = (y t , . . . ,y n } 
un subconjunto de V linealmente independiente. Defínase S' = {x,, ... , 
x n }, donde x t = y t y 

X* = y k - 2 - Xj para 2 < k < n. (1) 

î i I l x iIr 

Entonces S' es un conjunto ortogonal de vectores no nulos tales que 
'L(S') - L(S). 

demostración. La demostración se hará por inducción sobre n. Sea 
S n — {yi, . • • , .Vn}. Si n = 1 entonces el teorema se demuestra haciendo 
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5' = S t ; esto es, x, = y^O. Supóngase luego que el conjunto S' h = 
= {a:i, . .. , jc*} ha sido construido mediante el uso de la ecuación (1) 
con las propiedades necesarias. Demostraremos que el conjunto S' k i = 
= {*„ . .. , x k , jc* + 1 } tiene también las propiedades deseadas, donde 


’Mj' 

**+. =j* + .-2-y 1X; 




Si x k+1 — 0, entonces la ecuación (2) implicaría y :..i €L(S{) = L(S»), 
lo que contradice la suposición de que S i+1 es linealmente independiente. 
Para 1 < j < k tenemos de la ecuación (2) que 


(**+i> x ì) — (>'*+1> x ì) 2 —( x j. *<) 

= (y k+ ‘• JC ')“ í te^ll*'ll as=0 ' 

puesto que, de acuerdo con la suposición de que S' k es ortogonal, (Xj, 
Xi ) = 0 si x M /• Por lo tanto S' +1 es ortogonal. Ahora bien, mediante 
la ecuación (2) tenemos que L(S{ +1 ) C L(S* +1 ). Pero de acuerdo con el 
Teorema 7.3 S{ +t es linealmente independiente; luego dim(L(S' ; t )) = 
= k + 1 = dim(L(S* +1 )). Por lo tanto L(S; +1 ) = L(S* +1 ). ■ 

La construcción de {jc„ . . . , jc„} usando la ecuación (1) se llama pro- 
ceso de ortogonalizoción de Gram-Schrrddt. 


Ejemplo 12. Sea V = R 3 y sean y, = (1, 1, 0), y 2 = (2, 0, 1) e y 3 = 
= (2, 2, 1). Entonces {y„ y 2 , y 3 } es linealmente independiente. Utilizare- 
mos la ecuación (1) anterior para calcular los vectores ortogonales jc„ x 2 
y jc 3 . Tómese jc, = (1, 1, 0). Entonces [[ar 1 [| a = 2, y así 


x 2 =y 2 - 


II*. II 2 


= (2, 0, 1) — -y(l, 1, 0) 


= ( 1 ,- 1 . 1 ). 


Finalmente, 


-ÍZâlilv 0'3.*l) y 

- yi lìûF Xl ll * 2 || 2 2 

= (2,2, 1) - y(l, 1,0) - y(l, -1, 1) 

= (-11 AV 

l 3’ 3’ 3 / 


Teorema 7.5. Sea V an espacio dimensionalmente finito con producto interior. 
Entonces V tiene una base ortonormal fì. Además, si f3 = {x 1? x 2 , ... , x„} 
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y xÇV, entonces 

n 

x = 2 ( x » x i )Xj. 

i 1 

demostración. Sea /? 0 una base ordenada para V. Aplicando el Teore- 
ma 7.4 para obtener un conjunto ortogonal f3' de vectores no nulos con 
L(f3') = L(f3 0 ) — V. Dividiendo cada vector de /3' entre su longitud, 
obtenemos un conjunto ortonormal /3 que genera a V. De acuerdo con 
el Teorema 7.3, (3 es linealmente independiente y, por lo tanto, f3 es una 
base ortonormal para V. 

Sea /3~ [jc 19 . . . , y sea x£V. Entonces 

n 

A' — V aiXi 
i - l 

para algunos escalares a„ Para 1 < / < n tenemos que 
(x, Xj) - ^ ï?a,xi, Xj'j - 2oi(x,, Xj) 

= 2 « ì«ì i = aj. u 

i - i 

Ejemplo 13. Utilizando el conjunto ortogonal obtenido en el Ejemplo 12, 
podemos obtener la base ortonormal 

i<-,. ,. 2,j. 

Sea x - (2, 1, 3). Calcularemos los “coeficientes” de a: como se dan en 
el Teorema 7.5: 

fl, = -4- (2 + 1)= —__ = 4=t(2 - 1+3) — - 

V 2 V 2’ V 3 VT 

y 

a, - —-(-2 +1+6) =--- —- 

V 6 V 6 

Como verificación, tenemos que 

(2, 1, 3) -2-d, 1, 0) +1(1, -1, 1) +1(-1, 1, 2). 

Así pues tenemos una manera muy sencilla de calcular los coeficientes 
de un vector dado cuando se expresa como una combinación lineal de 
vectores en una base ortonormal. 

E1 mismo teorema proporciona un método sencillo para obtener la re- 
presentación matricial de un operador lineal. 
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Corofar/o. Sea V un espacio dimensionalmente finito con producto interior con 
una base ortonormal f3 — {x,, ... , x n }. Sea T un operador ortonormal en 
V, y sea A = [Tlp. Entonces A u = (T(Xj), Xi). 

demostración. Del Teorema 7.5 tenemos que 

T(jcy) = i (T(JC,), xDx,. 


Por lo tanto A i} — (T(*,), *<). ■ 


Los escalares (jc, x t ) asociados con a: han sido estudiados extensiva- 
mente para ciertos espacios vectoriales especiales. Aun cuando los vectores 
x l9 ... x n se escogieron de una base ortonormal, consideraremos conjun- 
tos /3 más generales para la definición de los escalares (*, x t ). 


Definición . Sea /3 un subconjunto ortonormal (posiblemente infinito) de un es- 
pacio con producto interior V, y sea xÇV. Definimos los coeficientes de 
Fourier de * relativos a /3 como los escalares (x, y), donde y£f3. 

En el siglo diecinueve el matemático francés Jean Baptiste Fourier 
estuvo dedicado al estudio de los coeficientes 


f: 


f(t) sen nt dt y 


f 


-7T 

f(t) cos nt dt, 


o, más generalmente, 


C n 



f(t)e int dt , 


de una función /. En el contexto del Ejemplo 9, vemos que c n -- (/, e ini )\ 
esto es, c n es el n-ésimo coeficiente de Fourier de una función continua 
/£H relativo a S. Estos coeficientes son los coeficientes “clásicos” de 
Fourier de una función; la literatura concerniente al comportamiento de es- 
tos coeficientes es bastante extensa. Aprenderemos más sobre estos coefi- 
cientes de Fourier en el resto de este capítulo. 


Ejemplo 14. Sean V = H y f(x) - x. Calculemos los coeficientes de Fou- 
rier de / relativos al conjunto ortonormal S del Ejemplo 9. Utilizando la 
integración por partes tenemos, para n 0, 


(/, e‘"‘) 


i n 

2^ J„ 


te' 


dt - 


— f * te- inl 

2^ J 0 


dl 


in 


Y para n — 0 


(/, 1 ) 


2tt 


f 


2tt 


t(l)dt = 77 . 
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Ahora bien, de acuerdo con el Ejercicio 14 tenemos que 

||/|| 2 > 2 |(/, 


Para toda k. Luego, empleando el hecho de que ||/|| 2 = -y ir 2 , tenemos 


4 * 

T * 2 > 2 

n .= 1 


~ 1 
in 


k l 


Como esta desigualdad es cierta para toda k, tenemos mediante el 
uso adecuado de los límites que 

4 x 1 

> 2 - 4 - 

Usando otras funciones pueden obtenerse otros resultados semejantes. 
Estamos ya preparados para proceder con el concepto de un “comple- 
mento ortogonal”. 


Definición. Sea V un espacio con producto interior y sea S un subconjunto de 
V. Definimos a S x como el conjunto de todos aquellos vectores de V 
que son ortogonales a todos los vectores de S; esto es, S x = ,{x e V: (x, y) 
= 0 para toda y £S}. A S 1 se le llama complemento ortogonal de S. 

Es fácil demostrar que S x es un subespacio de V para cualquier sub- 
conjunto S de V. 


Ejemplo 15. E1 lector deberá verificar que {0} x = V y V x = {0}. 

Ejemplo 16. Si V = R 3 y 5 = {*}, entonces 5 X es sencillamente el con- 
junto de todos los vectores que son perpendiculares a x. (Ver el Ejer- 
cicio 5.) 


E1 Ejercicio 16 proporciona un ejemplo interesante de un complemento 
ortogonal en el caso en que V sea dimensionalmente infinito. 

E1 uso de la palabra “complemento” se aclarará con el siguiente teo- 
rema. 


Teorema 7.6. Sea W un subespacio dimensionalmente finito de un espacio con 
producto interior V. Entonces V = W © W x . 

demostración. Por el Teorema 7.5 podemos escoger una base ortonor- 
mal (x’i, . .. , Xìt) para W. Entonces, para y£V, defínase 

k 

yi — 2 ( y, •«»)■«; y y 3 = y = y»!. 
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Es evidente que y ^ y x + y 2 y yi€W. Con el objeto de demostrar que 
V = W + W x , debemos demostrar que y 2 £ W x , para lo cual es sufi- 
ciente demostrar que (y 2 , yj) =0 para / = 1, . . . , k. Ahora bien, 

(y,, xj) = (y ~ y i9 Xf) = (y , ar>) - (y,, xj). 

Pero 

( fc \ Ar Ar 

S Ov. */)*/» ) = 2 0% */)(*/, */) = E (y. */)<5// = (>". x j)‘ 

/= i / /=i /=i 

Por lo tanto (y 2 , y ; ) = 0. 

Para completar la demostración debemos demostrar que W n W x 
= {0}. Pero si x e W n W x , entonces (x, *) = 0. Por lo tanto x ~ 0. ■ 

EI siguiente resultado es una consecuencia inmediata de la demostra- 
ción del Teorema 7.6. 

Corolario 1. Bajo la hipótesis del Teorema 7.6, si {x u . . . , x k ) es una base 
ortonormal para W y si y £ V, entonces 

k 

y = 2 (y, Xi)x t + z, 

î 1 

donde z e W x . 


Corolario 2. Sea V espacio con producto interior dimensionalmente finito y 
sea W un subespacio de V. Entonces dim(\N) + dim(V\/ L ) = dimQJ). 


Ejemplo 17. Sea V - F 3 y W - E({e u e 2 }). Entonces x = (a , b , c) £ W x 
si y sólo si 0 = (x, e x ) = a y 0 = ( x , e 2 ) = b. Así, * = (0, 0, c) y por 
lo tanto W^ — L((e 3 }). Se puede deducir el mismo resultado simplemente 
notando del Corolario 2 que dim(W x ) = 1 y que el vector c 3 es ortogonal 
tanto a e x como a c 2 . 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) E1 proceso de ortogonalización de Gram-Schmidt nos permite construir 
un conjunto ortonormal a partir de un conjunto arbitrario de vec- 
tores. 

(b) Todo espacio dimensionalmente finito con producto interior posee 
una base ortonormal. 

(c) E1 complemento ortogonal de cualquier conjunto es un subespacio. 
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(d) Si jr„} es una base para un espacio con producto inte- 

ri°r V, entonces, para cualquier jc C V, los escalares (x, Xi)(i= 1 , ... , 
n) son los coeficientes de Fourier de x. 

(e) Para cualquier subespacio W de un espacio con producto interior di- 
mensionalmente finito V, tenemos que V = W © W x . 

(f) Una base ortonormal debe ser una base ordenada. 

2. En cada uno de los incisos siguientes aplicar el proceso de Gram-Schmidt al 
subconjunto dado S del espacio con producto interior V. Entonces encontrar 
una base ortonormal /3 para V y calcular los coeficientes de Fourier para el 
vector dado relativos a /3. Utilizar, finalmente, el Teorema 7.5 para verificar 
el resultado. 

(a) V= R 3 ,5= {(1,0, 1,), (0, I, 1 ), (1, 3, 3)} y jc = (1, 1,2) 

(b) V= R\S= {(1, 1, 1), (0, 1, 1), (0,0, 1)} y x = (1,0, 1) 

(c) V = P 2 (/?) con el producto interior (/, g) = C' f(t)g(t)dt, 

S = {1, x, j: 2 } y f(x) = 1 + x 

(d) V = C\ S= {(1, i, 0), (1 - i, 2, 4/)} y x = {(/, 2.+ 3/, 1)} 

3. Sean V = R 2 y 



Encontrar los coeficientes de Fourier para (3, 4) relativos a /3. 

4. Sean V = C 3 y S = {(1,0,/), (1,2, 1)}. Calcular S 1 . 

5. Sean V = R 2 y S = {jr„} donde x o =£0. Describir geométricamente a .S' 

Si {jTj, jt 2 } So es linealmente independiente, describir geométricamente 
a S 1 . 

6 . Sea V un espacio con producto interior, y sea W un subespacio dimensional- 
mente finito de V. Si xg\N, demostrar que existe y Ç V tal que y e W ,J - pero 
con (j:, y) © 0. Sugerencia: Utilizar el Corolario 1 del Teorema 7.6. 

7. Demostrar que si {y J( . . , y„} es un conjunto ortogonal de vectores no nulos, 
entonces los vectores {x„ . .. , jr„} derivados del proceso de Gram-Schmidt 
satisfacen a x t = y, para /=!,...,«. Sugerencia: Utilizar inducción. 

8. Sea V = C 3 con el producto interior ordinario, y sea W = L({(/, 0, 1)}). 
Encontrar bases ortonormales para W y W L . 

9. Sea W un subespacio dimensionalmente finito de un espacio con producto 
interior V. Demostrar que existe una proyección T en W tal que N(T) = W : . 
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Además, demostrar que | |T(jc) [I < |Ijc|| para toda jcÇV. Sugerencia: Em- 
plear el Ejercicio 10 de la Sección 7.1. 

10. Sea A una matriz de n x n con elementos complejos tales que los renglones 
de A forman un conjunto ortonormal. Demostrar que AA* — I. 

11. Sean W, y W 2 subespacios de un espacio con producto interior dimensional- 
mente finito. Demostrar que (W t + W 2 ) x = Wf n V\/t y (W! n W 2 ) L = 

Wf + Wi*. 


12 . * Sea V un espacio con producto interior y sean S y S 0 subconjuntos de V. 

Demostrar los siguientes incisos: 

(a) S 0 S implica que S 1 - ç Sf. 

(b) S ç (S 1 ) 1 , y entonces L(S) ç (S 1 ) 1 . 

(c) Si W es un subespacio dimensionalmente finito de V, entonces 
W = ^ 1 ) 1 . Sugerencia: Utilizar el Ejercicio 6. 

13. Identidad de Parseval. Sea [x u . . . , x n ) una base ortonormal para V. De- 
mostrar, para cualesquiera x , y £ V, que 

(x, y) = 2 ( x » 

/= i 

14. Sea V un espacio con producto interior y sea S — (jr,, ... , jt,,} cualquier 
subconjunto ortonormal de V. Demostrar que para cualquier r en V tene- 
mos que 


IM|- > 2 |(+ *') I 3 . 

ì 1 

Esta desigualdad se llama desigualdad de Bessel. Sugerencia: Aplicar el 
Corolario 1 del Teorema 7.6 a r(V y W — L(S). Luego emplear el Ejer- 
cicio 10 de la Sección 7.1. 


15. Sea T un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Si (T(jr), y) = 0 para toda x, y€V, demostrar que T — T 0 . 
De hecho, demostrar este resultado si la igualdad se cumple para toda x e 
y en alguna base para V. 


16. Sea V = C([ 1, 1]). Supóngase que W e y W 0 son los subespacios de V 

formados por las funciones pares e impares, respectivamente. Demostrar 
que Wf = W 0 si el producto interior en V es 


(/> z) 



f(t)g(t)dt. 
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7.3 EL ADJUNTO DE UN OPERADOR LINEAL 

En la Sección 7.1 definimos a la transpuesta conjugada A* de una matriz 
A. Para un op>erador lineal T en un espacio con producto interior V, defi- 
niremos ahora un operador lineal relacionado en V llamado el “adjunto” 
de T, cuya matriz es [T]*, donde /3 es cualquier base ortonormal de V. 
La analogía entre la conjugación compleja de números complejos y los ad- 
juntos de los operadores lineales pronto se hará aparente. Primero, sin 
embargo, necesitamos un resultado preliminar. 

Sea V un espacio con producto interior y sea yÇV. La función 
g: V —» F definida mediante g(jr) = (x, y) para toda x £ V es claramente 
lineal. Más importante es el hecho de que si V es dimensionalmente finito, 
toda transformación lineal de V en F es de esta forma. 

Teorema 7.7. Sea V un espacio con producío interior dimensionalmente finito 
sobre F, v sea g: V —» F una transformación lineal. Entonces existe un 
vector único y Ç V tal que g(x) = (x, y) para toda xÇV. 

demostración. Sea /3 una base ortonormal para V, digamos p — {jtj,. . ., 
jt„}, y sea 

n _ 

y - 2 g( at^)jcj. 

i ~ 1 

Si definimos a h: V—>F mediante h(jt) = ( x , y), entonces h es clara- 
mente lineal. Ahora bien, para 1 < / < n tenemos 

/ n _ \ n 

h (Xj ) (Xjy y) í Xj, 2 g(^ ì)xì J ^ g (Xi) (xj, x t ) 

\ i - 1 J i - 1 

n 

- 2 g(JC ì)S;ì = g(x ; ). 

i = 1 

Como g y h coinciden en /?, tenemos, de acuerdo con el corolario del 
Teorema 2.7, que g = h. 

Para demostrar que y es única, supóngase que g(x) = ( x , y') para 
toda x. Entonces ( x , y) — ( x , y') para toda x y entonces por el Teorema 
7.1 tenemos que y = y'. ■ 

Ejemplo 18. Defínase a g: R 2 R mediante g (a u a 2 ) = 2a t + a 2 , evi- 
dentemente g es una transformación lineal. Sea /3 1= {e u e 2 ) y , como en 
la demostración del Teorema 7.7, sea y — g(e^)e x -h g(e 2 )e 2 = 2e x + 
+ e 2 — (2, 1). Entonces g(a,, a 2 ) = ((«,, a 2 ), (2, 1)) = 2a x + a 2 . 

Teorema 7.8. Sea V un espacio con producto interior dimensionalmente finito 
y sea T un operador lineal en V. Entonces existe un operador lineal único 
T* en V tal que (T(x), y) (x, T*(y)) para toda x, y £V. 
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demostración. Sea y 6 V. Defínase a g: V —> F mediante g(x) = 

= (T(jc), y) para toda jc£V. Primero demostraremos que g es lineal. Sean 

^£Vyc£F. Entonces g(cXi -f x>) = (T(c*i + x>), y) = (cT(*i) + 
+ T(x 2 ), y) = c(T(^), y) + (T(jc 2 ), y) = cg(jr x ) + g(jr 2 ). Por lo tan- 
to, g es lineal. 

Ahora podemos emplear el Teorema 7.7 para obtener un vector único 
y' £V tal que g(jr) = (j:, /); esto es (ì(x), y) = (x, /), para toda Jr €V. 
Definiendo a T*: V -» V mediante T*(y) = /, tenemos que (T(j:), y) = 
= U, T*(y)). 

Para demostrar que T* es lineal, sean y t , ^ÇV y c£F. Entonces para 
cualquier jc Ç V tenemos 

(x, T*(c^i + y 2 )) = (T(x), cy i + y 2 ) 

= c(T(jc), yO + (T(*), y 2 ) 

= 7(jc, T*(yD) + (jc, T*(y 2 )) 

= (JC, cT*( yi ) + T*(y 2 )). 

Como jc es arbitraria, tenemos que T *(cy v + y>) = cT*(y,) + T*(j 2 ) de 
acuerdo con el Teorema 7.1 (d). 

Finalmente, sólo nos queda demostrar que T* es única. Supóngase que 
U: V-4V es lineal y satisface a (T(x), y) — (x , U(y)) para toda x , 
y£V. Entonces (jc, T*(y)) = (jc, U(y)) para toda jc, y£V y finalmente 
T* - U. ■ 

E1 operador lineal T* descrito en el Teorema 7.8 se llama adjunto del 
operador T. E1 símbolo T* se lee “T asterisco”. 

Luego, T* es el único operador en V que satisface a (T(jt), y) = 
= (x, T*(y)) para toda jc, yÇV. Nótese que también 

(X, T (y)) = (T(y), x) - (y, T*(x)) = (T*(x), y) 

y así (jc, T(y)) = (T*(jc), y) para toda jc, y £V. Podemos ver estas ecua- 
ciones simbólicamente como que anadimos un * a T cuando oambiamos 
su posición dentro del símbolo de producto interior. 

En el caso dimensionalmente infinito, el adjunto de un operador lineal 
T puede definirse como el operador lineal T* que satisface a (T(jc), y) = 
= (*, T*(y)) para toda jc, .yÇV. La unicidad de T* se deducirá como 
anteriormente. Sin embargo, no se garantiza la existencia de un adjunto. 
E1 lector deberá observar la necesidad de la hipótesis de dimensionalidad 
finita en la demostración del Teorema 7.7. Muchos de los teoremas que 
demostraremos sobre adjuntas son, sin embargo, independientes de la di- 
mensión de V. Entonces, para el resto de este capítulo, adoptaremos para 
îos ejercicios la convención de que, una referencia al adjunto de un ope- 
rador lineal en un espacio con producto interior dimensionalmente infinito, 
presupone que tal adjunto existe. 

Un resultado útil para obtener adjuntos es el Teorema 7.9 que sigue. 
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Teorema 7.9. Sea V un espacio con producto interior dimensionalmente finito, 
y sea ft una base ortonormal para V. 5/ T es un operador lineal en V, en - 
tonces 

demostración. Sean A — [T]( 5 , B = [T*]p y /î = {jc,, .... *„}. Enton- 
ces, del corolario del Teorema 7.5, tenemos que 

B,, = (T*(je 7 ),jri) = (x~, T*(jc>) ) 

= (T(jfi), JJ) = Â~= 

Por lo tanto B = A*. ■ 

Corolario. Sea A una matriz de n x n. Entonces = (L x )* . 

demostración. Si /8 es la base ordenada estándar para F" entonces, en 
virtud del Teorema 2.17, tenemos que [L,l ( 5 = ./1. Por lo tanto, 
[(U*h = [LJ? = A* = [!_,.]„ y así (L,)* = L,.. ■ 

Corno aplicación de lo anterior, calcularemos el adjunto de un ope- 
rador lineal específico. 

Ejemplo 19. Sea T: C'- —» C- definido mediante T(a,, a 2 ) =- (2ia, + 3 a 2 , 
a, - a.). Si (8 es Ia base ordenada estándar para C 2 , entonces 

Luego 

IT*), ■= itç = (“j’ _[). 

Por lo tanto 

T *(a u a>) — (-2/(7, + a>, 3«j — a>). 

E1 siguiente teorema demuestra la analogía entre los complejos con- 
jugados de los números complejos y los adjuntos de los operadores li- 
neales. 

Teorema 7.10 . Sea V un espacio con producto interior dimensionalmente fini - 
to y sean T y U operadores lineales en V. Entonces 

(a) (T + U)* = T* + U*. 

(b) (cT)* - cT* para cualquier c( F. 

(c) (TU) * = U*T*. 

(d) t** — T. 

(e) I* = I. 
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demostración. Demostraremos (a) y (d); el resto se demuestra de la 
misma manera. Sea jc, yÇV. 

Como 

(x , (T + U)*(v)) = ((T -f U) (*), y) = (T(jr) + U(jc), y) 

= (T(jc), y) + (U(jc), y) = (jc, T*(y)) -I- U, U*(y)) 
= (x, T*(y) + U*(y)) = (jc, (T* + U*)(y)), 

se sigue ei inciso (a). 

De la misma manera, como 

(x, T(y)) - (T*U),v) 

= (x, T**(y) ), 

se obtiene (d). ■ 

La misma demostración opera en el caso dimensionalmente infinito, 
siempre y cuando se suponga la existencia de T* y U*. 

Corolario . Sean A y B matrices de n x n. Entonces 

(a) (A + B)* = A* f B*. 

(b) (cA)* = cA* para toda cÇF. 

(c) (AB)* = B*A*. 

(d) A** = A. 

(e) I* = 1. 

demostración. Demostraremos únicamente el inciso (c), los incisos res- 
tantes se pueden demostrar de manera semejante. 

Como L {as) . = (L^)* - (L A L B )* - (L B )*(L A )* = L B .L A . = L BM ., tene- 
mos que (AB)* = B*A*. ■ 

En la demostración anterior nos apoyamos en el corolario del Teore- 
ma 7.9. Una demostración aiternativa se daría acudiendo directamente a 
la definición de transpuesta conjugada. (Ver Ejercicio 5.) 


EJERCICIOS 

ì. Decir si las siguientes afirmaciones son verdaderas o falsas. Considérese que 
los espacios con producto interior subyacentes son dimensionalmente fi- 
nitos. 

(a) Todo operador lineal tiene un adjunto. 

(b) Todo operador lineal en V tiene la forma x(x, y) para alguna 
y£V. 

(c) Para todo operador lineal T en V y toda base ft de V, [T*]^ = 

-- (UW*- 
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(d) E1 adjunto de un operador lineal es siempre único. 

(e) Para operadores cualesquiera T y U, y escalares a y b. 



(aT + b U)* = aT* + bU*. 


(f) 

(g) 

Para cualquier matriz A de rt x n, (U) * = L 
Para cualquier operador T, (T*)* = T. 


Para cada uno de Ios siguientes espacios con producto interior V (sobre F) 
y transformaciones lineales g: V —» F, encontrar un vector y tal que 
9 (-*•) = (j-, y) para toda x£V. 

(a) 

(b) 

V = R 3 , g(aj, a 2 , a s ) = a, - 2a-, + 4a 3 
v = C 2 , g(z„ z>) = Zi - 2z 2 


(c) 

V = P 2 (R) con (/, h) J' j(l)h(t)dt, g(/) - 

/(0) + /'(1) 


3. Para cada uno de los siguientes espacios con producto interior V y opera- 
dores lineales T en V, evaluar T* en el elemento dado de V. 


(a) 

V = R 2 , 

T(a, b) — (2a + b, a — 3 b), x 

(b) 

V = C 2 , 

T(Zi, z 2 ) = (2zi + iz 2 , (1 — i)zi ), 



x = (3 - í, 1 + 20 

(c) 

V = ? 2 (R) 

con 


(/, 8) = £ f(t)g(t)dt, T(/) = /' + 3/, 

f(x) = 4 - x + 3x 2 

4. Completar la demostración del Teorema 7.10. 

5. Completar la demostración del corolario del Teorema 7.10 de dos maneras. 
Primero emplear el Teorema 7.10 tal como en la demostración de (c). Lue- 
go emplear la definición matricial de A*. 

6. Sea T un operador lineal en un espacio con producto interior V. Sean 
Ui = T + T* y IL = TT*. Demostrar que U, = Uf y U 2 = Uf. 

7. Dar un ejemplo de un operador lineal T en un espacio con producto interior 
V tal que N(T) =£ N(T*). 

8 . Sea V un espacio con producto interior dimensionalmente finito, y sea T 
un operador lineal en V. Demostrar que si T es invertible, entonces T* es 
invertible y (T*) _1 m (T -1 )*. 

9. Demostrar que si V = W @ W 1 y T es la proyección en W con N(T) = W- L , 
entonces T = T*. 
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10. Sea T un operador lineal en un espacio con producto interior V. Demos- 
trar que ||T(jc)|| — j| jc[ j para toda jcÇV si y sólo si (T(jc), T(y)) — (jc, y) 
para toda jc, y ÇV. Sugerencia: Emplear el Ejercicio 20 de la Sección 7.1. 

11 . Para un operador lineal T en un espacio con producto interior V, demostrar 
que T*T — T n implica que T = T 0 . ^Es cierto el mismo resultado si supone- 
mos que TT* = T 0 ? 

12. * Sea V un espacio con producto interior dimensionalmente finito y, sea T 

un operador lineal en V. Demostrar que R(T*) = N(T)- 1 . Sugerencia: De- 
mostrar que R(T*) X = N(T), y luego utilizar el Ejercicio 12(c) de la Sec- 
ción 7.2. 

13. Sea T un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Demostrar los siguientes incisos. 

(a) N(T*T) N(T). Deducir que rango(T*T) = rango(T). 

(b) rango(T) = rango(T*). Deducir de (a) que rango(TT*) = rango(T). 

(c) Para cualquier matriz A de n x n, rangoM*/!) — rar\go(AA *) = ran- 
go (A). 

14. Sea V un espacio con producto interior y sea y, z € V. Defínase a T: V —> V 
mediante T(jc) (jc, y)z para toda jcÇV. Primero demostrar que T es 
lineal. Luego demostrar que T* existe y definirla explícitamente. 

15. Sea T: V W una transformación lineal entre los espacios con producto 
interior dimensionalmente finitos V y W. 

(a) Demostrar que existe una transformación lineal única T*: W—>V 

tal que (T(jc), y) (x , T*(y)) para toda x£V, y£W. 

(b) Sean p y y las bases ortonormales respectivas para V y W. Demos- 
trar que [T*]f = ([T]p*. 

16. Sea A una matriz de n x n. Demostrar que det(/í*) = det(/f). 


7.4* LA TEORIA ESPECIAL DE LA RELATIVIDAD DE EINSTEIN 

Como resultado de los experimentos físicos realizados durante la segunda 
mitad del siglo diecinueve (de una manera más sobresaliente, el experi- 
mento de Michelson-Morley de 1887), los físicos concluyeron que los re- 
suîtados obtenidos en la medición de la velocidad de la luz son indepen - 
dientes de la velocidad del instrumento utilizado para medirla. Por 
ejemplo, supóngase que estando en la Tierra un experimentador mide la 
velocidad de la luz emitida por el Sol y encuentra que es de 300 000 
lcilómetros por segundo. Ahora supóngase que el experimentador coloca 
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el equipo de medición en una nave espacial y abandona la Tierra viajando 
a 160 000 kilómetros por segundo alejándose del Sol. Una repetición del 
mismo experimento desde la nave espacial arrojaría el mismo resultado: 
jLa luz está viajando a 300 000 kilómetros por segundo relativa a la nave 
espacial y no a 140 000 kilómetros por segundo como era de esperarse. 

Esta revelación condujo a una nueva manera de relacionar los sistemas 
coordenados empleados para ubicar a los eventos en el espacio-tiempo. 
E1 resultado fue la teoría especial de la relatividad de Albert Einstein. 
Desarrollaremos la esencia de la teoría de Einstein desde el punto de 
vista del álgebra lineal. 

E1 problema básico es comparar dos distintos sistemas de coordenadas 
sin aceleración, que están en movimiento relativo uno con respecto al otro 
bajo la suposición de que la velocidad de la luz es la misma, medida en 
ambos sistemas. Supóngase que nos dan dos sistemas coordenados iner- 
ciales (sin aceleración) S y S' en un espacio de tres dimensiones (R 1 2 3 ) 
y tales que S' se desplaza a una velocidad constante en relación con 5, 
medida a partir de S (ver la Fig. 7.2). Para simplificar las cosas, supon- 
gamos que: 


Z 1 



1. Los ejes correspondientes de S y S' (x y x\ y e /, z y z') son 
paralelos y el origen de S' se desplaza en la dirección positiva 
del eje x de S a una velocidad constante o > 0 relativa a S. 

2. Se colocan dos relojes C y C' en el espacio —el primero estacio- 
nario relativo al sistema de coordenadas S y el segundo estacionario 
relativo al sistema de coordenadas S '. Estos relojes están disena- 
dos para dar como lecturas números reales en unidades de tiempo 
(segundos). Se calibran los relojes de manera que en el instante 
en que los orígenes de S y S' coincidan, ambos relojes den la 
lectura cero. 

3. Nuestra unidad de longitud será el segundo luz (la distancia que 
recorre la luz en un segundo) y nuestra unidad de tiempo será el 
segundo. Nótese que con respecto a estas unidades la velocidad 
de la luz es de un segundo luz por segundo. 
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Dado un evento cualquiera (cualquier cosa cuya posición y tiempo de 
ocurrencia pueda ser descrito) le podemos asignar un conjunto de coor- 
denadas de << espacio-tiempo , \ Por ejemplo, si p es un evento que ocurre 
en una posición 

x 

y 

z 


relativa a S en un tiempo í leído en el reloj C, podemos asignar a p 
el conjunto de coordenadas 

x 

z 

t 

Esta cuarteta ordenada se denomina las coordenadas espacio-tiempo de 
p relativas a S y a C. De la misma manera p tiene un conjunto de coor- 
denadas espacio-tiempo 




relativas a S' y a C'. 

Podemos definir un mapeo T r : R 4 —> R 1 (que depende de la veloci- 
dad v) como consecuencia de lo anterior tal que, para cualquier conjunto 
de coordenadas de espacio-tiempo 

x 

y 

z 
t 


que miden un evento con respecto a S y a C, 



es el conjunto de coordenadas espacio-tiempo de este evento con respecto 
a S' y a C'. Es evidente que T„ es uno-a-uno y sobreyectivo. 

Einstein hizo ciertas suposiciones sobre T r que condujeron a su teoría 
especial de la relatividad. Formularemos un conjunto equivalente de supo- 
siciones. 



406 Espacios con producto interior 


Axiomas de la teoría especial de la relatividad 

R,: La velocidad de cualquier haz de luz, al ser medida en cualquiera 
de los sistemas coordenados utilizando un reloj estacionario rela- 
tivo al mismo sistema, es 1. 

R 2 : E1 mapeo T r : R 4 —> R 4 es lineal. 

R 3 : Para cualquier 



x ' y t' son independientes de y y z\ esto es, si 



entonces x" — x' y t" — t'. 


R 5 : E1 origen de S se desplaza en la dirección negativa del eje X' 
de S' a una velocidad constante — v < 0 medida desde S'. 


Como veremos, estos 5 axiomas (R,, R., R 3 , R, y R 5 ) caracterizan 
completamente a T r . EI operador T r se llama transformación de Lorentz 
en la dirección x. Pretendemos calcular T„ y utilizarla para estudiar los 
curiosos fenómenos de la contracción del tiempo. 


Teorema 7.7 7. En R 4 

(a) T v (et) = e^ para i = 2, 3. 

(b) L((e 2 , e 3 }) es T v -invariante. 
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(c) L({ei, e 4 }) es 1,-invariattte. 

(d) Líle;., e 3 }) >' L({ej, e,}) son T *-invariantes. 

(e) T*(ej) — e^ para i = 2, 3. 

DEMOSTRACIÓN. 

(a) Por el axioma R 2 


l°\ /°\ 



y P°r lo tanto, por el axioma R,, las coordenadas primera y cuarta de 



son iguales a cero para cualquier a, b £R. Luego, por el axioma R 3 



Las demostraciones de los incisos (b), (c) y (d) se dejan como ejer- 
cicios. 

(e) Para cualquier j 2, en virtud de (a) y (c), (T*(e 2 ), ef) = 
(** L(cy)) - 0; para j = 2, por (a), (T*(e 2 ), ej) = \e 2 , T r (e 2 )) 
(e 2 , e 2 ) = l. Concluimos que T*(e 2 ) es un múltiplo de e 2 , o sea que 
T*^) - Àe 2 para alguna \£R. Entonces 1 = (e 2 , e 2 ) = (e 2 , T„(e 2 )) = 

— ( T *( e -j), e 2 ) — (Àe 2 , e 2 ) = À y, por lo tanto, T*(e 2 ) = e 2 . De Ia 
misma manera T*(e 3 ) = e.. ■ 

Supóngase que en el instante en el que los orígenes de S y S' coin- 
ciden se emite un destello luminoso desde su origen común. Cuando este 
evento se mide relativo a S y C o relativo a S' y C' tiene coordenadas 
espacio-tiempo 
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Sea P eì conjunto de todos los eventos cuyas coordenadas espacio-tiempo 

(x\ 

y 

2 

\tl 

relativas a S y C son tales que el destello se observa en el punto de 
coordenadas 

y 

2 



(medidas con respecto a S ) en el instante t (medido en C). Permítasenos 
caracterizar a P en términos de jc, .v, z y t. Como la velocidad de la 
luz es 1, en cualquier instante t > 0 el destello se observa desde cualquier 
punto cuya distancia al origen de S (medida a partir de S) sea t • 1 -- t. 
Estos son justamente los puntos que se localizan sobre Ia superficie de 
la esfera de radio t con centro en el origen Las coordenadas (relativas 
a 5) de tales puntos satisfacen la ecuación x- + y 1 + z 1 -- t 2 . Por lo tanto, 
un evento está en P si y sólo si sus coordenadas espacio-tiempo relativas 
a S y a C 


( X \ 

y 

2 

\tl 


(t> 0) 


satisfacen la ecuación x 2 + y 2 + zr — t 2 0. En virtud del axioma R, 
podemos caracterizar a P en términos de las coordenadas espacio-tiempo 
relativas a 5' y a C' de la misma manera: un evento está en P si y sólo 
si sus coordenadas espacio-tiempo relativas a 5' y a C' 


l x '\ 

y' 

z' 

\t'l 


0 ' > 0 ) 


satisface Ia ecuación (x ') 1 
Sea 


1- (/)* I- (zT- - ( f)- - 0. 


A = 


/10 0 
0 1 0 
0 0 1 
\0 0 0 


°\ 

0 

0 

- 1 / 
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Teorema 7.12. Para cualquier w£R\ si (L A (w), w) = 0, entonces (T*L A T v (w), 
w) = 0. 


DE MOSTRACIÓN . Sea 


w = 


/*\ 

y 

z 

\tl 


e R 4 , 


y supóngase que (LaÍvv), w) = 0. 


Caso 1. t > 0. Como (L A (vv), w) = x 2 + y 2 + z 2 — t 2 , >v es el conjunto 
de coordenadas de un evento de P relativos a S y a C. Como 


jx\ 


i x ) 

A 

y 

i t 

z ! 


z i 

\tì 




son las coordenadas espacio-tiempo del mismo evento relativas a S' y a 
C', la discusión que precede al Teorema 7.12 da 

(jc ') 2 + (y') 2 + (z') 2 - (í') 2 - 0. 

Luego entonces, (T*LaT,(w), w) = (LaT,..(w), T p (w)) = (jc') 2 + (y') 2 + 
+ (z') 2 — (t') 2 = 0, y se obtiene la conclusión. 


Caso 2. t < 0. La demostración se obtiene al aplicar el Caso 1 a — w.| 
Procedamos ahora a deducir información acerca de T r . Sean 



H 


i \ 


o 1 


0 


0 

y w 2 = 

0 


\li 


\— 1/ 


Por el Ejercicio 3, (wj, w 2 ) es una base ortogonal para L({ej, e t }), y 
L((<?j, e,}) es T*LAT ir invariante. E1 siguiente resultado nos dice aún más. 


Teorema 7.13. Existen escalares a y b no nulos tales que 

(a) T*L a T v (Wj) = aw 2 , 

(b) T*L a T v (w 2 ) = bWj. 


DEMOSTRACtÒN. 

(a) De acuerdo con el Teorema 7.12, (La(wj), w,) = 0, (T*L A T„ 
(w,), w,) = 0. Entonces, T*LaT,(w,) es ortogonal a w,. Como L((ej, 



410 Espacios con producto interior 


e 4 }) = L({w u W;}) es THJ.-invariante, T*L.,T,.(h’ i ) debe pertenecer a 
este conjunto. Pero {h»,, w a } es una base ortogonal para este subespacio, 
y entonces T*L ,T,.(h’, ) debe ser un múltiplo de Así, T*L ,T ( . (vv,) = aw.. 
Para algún escalar a. Como T r y A son invertibles, también T*L.,T,. Io es. 
Luego íi^O, demostrando así (a). La demostración de (b) es seme- 
jante. ■ 


Corolario. Sea B, — [T, donde fì es la base ordenada estándar para R'. En- 
tonces 


(a) B*AB V A. 

(b) T*L.J V - L,. 


Dejaremos como ejercicio la prueba del corolario. Para algunas suge- 
rencias, véase el Ejercicio 4. 

Consideremos ahora la situación cuando ha transcurrido un segundo 
desde que Ios orígenes S y S' coincidieran medido por el reloj C. Como el 
origen de S' se desplaza a lo largo del eje at con una velocidad v medida 
en S, sus coordenadas espacio-tiempo relativas a S y C son 


tv\ 

0 

0 

\l/ 

De la misma manera, las coordenadas espacio-tiempo para el origen de 
S' relativas a S' y a C' deben ser 

/°\ 

0 

0 

\t'ì 

para algún t' > 0. Entonces tenemos que 


/v\ 


(°\ 

0 


0 

°j 


0 

\l/ 

1 

1/7 


para algún t' > 0. 


Por el corolario del Teorema 7.13 


(3) 



( v ) 


( V \ 

\ 




( v ) 

\ 


0 


0 



0 


o 


TfLJ,. 




— 

L., 






°J 


0 



í° 


°J 





il/ 

/ 

\ 

ll/ 


\l) 

! 

/ 


= v 2 - 1. 


(4) 
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Pero también 


TíL/r, 


= LT, 


° T ° 
0 ’ ’ 0 


' 0 \ / 0 ' 


0 ’ 0 


Combinando las ecuaciones (4) y (5), concluimos que 

v 2 — 1 - (/')-, o bien /' -- V1 ' tr. 

Luego, de las ecuaciones (3) y (6), obtenemos 

/ v \ / 0 \ 


\ 1 / V1 — v 2 l 

Recuérdese luego que el origen de S se desplaza en la direccion nega- 
tiva del eje x de 5' con la velocidad constante — v < 0 medida desde S'. 
(Este hecho es el axioma R r . ) En consecuencia, un segundo después de 
que los orígenes de S y S' coincidieran medido con el reloj C, existe un 
tiempo /' > 0 medido en el reloj C' tal que 


De la Ecuación (8) se obtiene, de una manera semejante a como se 
obtuvo la Ecuación (7), que 


V* — vl 

y, por lo tanto, de las Ecuaciones (8) y (9) 


1 ~ v \ 

VI 

— V 2 


0 


0 


1 

W\ 

— v 2 ! 


E1 siguiente resultado se puede demostrar fácilmente utilizando las Ecua- 
ciones (7) y (10), y el Teorema 7.11. 




412 


Espacios con producto interior 


Teorema 7.14 . Sea /3 la base ordenada estándar para R\ Entonces 


I 1 


[TJ, - B v 


J\ — v 2 
0 
0 
— v 


WÌ — V 2 


0 0 

1 0 
0 1 

0 0 


'V \ 


yr- v 2 

0 

0 

1 


- V 2 / 


Contracción del tiempo 

Una conclusión por demás curiosa y paradójica se deriva si aceptamos la 
teoría de Einstein, la de la contracción del tiempo. Supóngase que un 
astronauta abandona nuestro sistema solar en una nave espacial que viaja 
a una velocidad fija v medida con respecto a nuestro sistema solar. Se 
tiene de la teoría de Einstein que al final del tiempo t medido desde la 
Tierra, el tiempo que habrá transcurrido en îa nave espacial es únicamente 
/V 1 — v-. Para establecer este resultado, considérense los mismos siste- 
mas de coordenadas S y S' y los relojes C y C’ que estudiamos antes. Su- 
póngase que el origen de S' coincide con la nave espacial y que el origen 
de S coincide con un punto en el sistema solar (estacionario con relación 
al Sol), de manera que los orígenes de S y S' coincidan y los relojes C 
y C' den una lectura de cero en el momento en el que el astronauta 
inicia su viaje. 

Visto desde S , las coordenadas espacio-tiempo del vehículo en cual- 
quier instante t > 0 medidas por C son 

tvt\ 

0 

0 

\tl 

mientras que vistas desde S' Ias coordenadas espacio-tiempo del vehículo 
en cualquier instante t' > 0 medidas por C' son 

/°\ 

0 

0 

\fì 

Pero si dos conjuntos de coordenadas de espacio-tiempo 


/vt\ 


/°\ 

0 

y 

0 

°l 

1 

0 

11 


{t’l 
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describen el mismo evento, debe tenerse que 


(vt\ 


/°\ 

0 ' 


0 

°l 


0 

11 


\t'l 


Luego entonces 


1 

0 

0 

—V \ 




Vl — V 1 

V 1 — V 2 \ 

l 

(vt\ 


/°\ 

0 

1 

0 

0 


0 1 


0 

0 

0 

1 

0 


°J 


0 

— V 

0 

0 

1 . 1 


u 


\t'l 

IV 1 — v 1 

Vl — V 2 ' 





De la ecuación anterior se tiene que 

v 1 +_ l ——- ~ t' , o bien /' t V 1 — v 2 ( 11 ) 

V 1 — V 2 V 1 “ V 2 


Este es el resuîtado deseado. 

Una consecuencia dramática de la contracción del tiempo la propor- 
ciona el Ejercicio 9 al final de esta sección. 

Hagamos una consideración adicional. Supóngase que las unidades de 
distancia y tiempo que consideramos son unidades que se usan más común- 
mente que el segundo-luz y el segundo, tales como la milla y la hora, o 
el kilómetro y el segundo. Sea c la velocidad de la luz en las unidades 
que hayamos seleccionado para la distancia y el tiempo. Se puede ver 
fácilmente que si un objeto viaja a una velocidad v relativa a un conjunto 
de unidades, entonces viaja a una velocidad v/c en unidades de segundos- 
luz por segundo. Así, para un conjunto cualquiera de unidades de distancia 
y tiempo, la Ecuación (11) se transforma en 


t' 



EJERCICIOS 

1. Demostrar los incisos (b), (c) y (d) del Teorema 7.11. 

2. Completar la demostración del Teorema 7.12 para el caso t < 0. 
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3. Para 

í 1 ] 

0 

Hl “ 0 

\l/ y ^ 

demostrar que 

(a) {h’i, h' 2 } es una base ortogonal para L({e u e,}). 

(b) L({e,, e,}) es T*L.iT,,-invariante. 

4. Demostrar el corolario del Teorema 7.13. 

Sugerencias: 

(a) Demostrar que 

P 0 0 q\ 

0 10 0 
0 0 1 0 ’ 
-9 0 0 -p) 

donde 




a + b a — b 

p = y « -—• 

(b) Demostrar que q ~ 0 utilizando el hecho de que B*AB y es autoad- 
junta. 

(c) Aplicar el Teorema 7.12 a 



para demostrar que p - 1. 


5. Demostrar que 



Sugerencia: Utilizar una técnica similar a la que se empleó en la obtención 
de la Ecuación (7). 
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6. Dados tres sistemas coordenados S, S' y S" con ejes correspondientes ( x , x', 
x y, /, y"; y z , z', z") paralelos y tales que los ejes x, x' y x" coinciden. 
Supóngase que 5' se mueve delante de S con una velocidad v x > 0 (medida 
en S), S" se mueve delante de S' con una velocidad v 2 > 0 (medida en S') 
y S" se mueve delante de S con una velocidad v A > 0 (medida en S), y que 
existen tres relojes C, C' y C" tales que C es estacionario con relación a 
S, C' es estacionario con relación a S' y C" es estacionario con relación 
a S". Supóngase que cuando en cualquiera de los tres relojes se mide el 
tiempo cero, Ios orígenes de S, S' y S" coinciden. Suponiendo que T r3 = T v J Vl 
(esto es B r B Vl B rx ), demostrar que 

V\ + Vo 
v * = TI-* 

Nótese que el sustituir v., 1 en la ecuación anterior se obtiene v :i " 1. Esto 

nos dice que la velocidad de la luz medida en S o S' es la misma. <Por qué 
nos sorprendería si esto no ocurriera? 

7. Calcular (B v ) '. Demostrar que (B r ) 1 r - r B i r) . Conclúyase que si S' se 
mueve a una velocidad negativa v relativa a S, entonces [T r ]p B r , donde 
B r tiene la forma dada en el Teorema 7.14. 

8 . Supóngase que un astronauta abandonó la Tierra en el ano de 1776 y viajó 
a una estrella situada a 99 anos luz de la Tierra a una velocidad de 99% 
de la velocidad de la luz, y llegando a la estrella emprendió de inmediato el 
regreso a la Tierra a la misma velocidad. Considerando la teoría especial 
de la relatividad de Einstein, demostrar que si el astronauta tenía 20 anos de 
edad en el momento de su partida, regresaría a la Tierra a la edad de 48.2 
anos en el ano de 1976. Explicar la utilidad del Ejercicio 7 al resolver 
este problema. 

9. Recuérdese la nave espacial en movimiento considerada en el estudio de la 
contracción del tiempo. Supóngase que el vehículo se desplaza hacia una 
estrella fija localizada en el eje x de S a una distancia de b unidades del 
origen de S. Si la nave espacial viaja hacia la estrella à una velocidad v, 
los habitantes de la Tierra (que permanecen “casi” estacionarios con respecto 
a S) calcularán que el tiempo que le toma al vehículo alcanzar la estrella 
es t = b/v. Debido al fenómeno de contracción deî tiempo el astronauta 
percibirá un tiempo de t' = t^j I - v z = (b/v) V 1 — v 2 . Aparece una para- 
doja en el hecho de que el astronauta percibe un tiempo inconsistente con 
una distancia b y una velocidad v. Pero la paradoja se resuelve observando 
que la distancia desde el sistema solar a la estrella medida por el astronauta 
es menor que b. 

Suponiendo que los sistemas coordenados S y S' y los relojes C y C' 
son los descritos en la exposición de la contracción del tiempo, 
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(a) Discutir que en el tiempo t (medido en C) las coordenadas espacio- 
tiempo de la estrella relativas a S y C son 

(b\ 

0 

0 

tf 

(b) Demostrar que en el tiempo t (medido en C) las coordenadas espacio- 
tiempo de la estrella relativas a S' y C' son 


(c) 



0 

0 


\ t ~bv \ 

Haciendo 

. b — tv . t — bv 

x — — - y = .. 

V 1 — v- V i v ~ ’ 


demostrar que x' ~ /?V I ~ v- — t'v. 

Este resultado se puede interpretar como que en el tiempo /' medido por el 
astronauta, la distancia del astronauta a la estrella, medida por el astro- 
nauta (ver Ia Fig. 7.3), es 


b \/ 1 - v 2 — t'v. 



(v, 0, 0) 
coordenadas 
relativas 
a .V' 


( b , 0 , 0 ) 
coordenadas 
relativas 
a S 


(estrella) 


(d) Conclúyase de esto que 

(Ì) La velocidad de la nave espacial con respecto a Ia estrella me- 
dida por el astronauta es v. 

(ii) La distancia de la Tierra a la estrella medida por el astronauta 
es b V 1 v-. 
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Así, las distancias a lo largo de la línea de movimiento del vehículo espa- 
cial aparecen contraídas por un factor de V 1 — v 2 . 


7.5 OPERADORES NORMALES Y AUTOADJUNTOS 

En esta sección demostraremos que en cualquier espacio con producto 
interior dimensionalmente finito existe una clase de operadores lineales to- 
talmente determinados por sus eigenvalores. Específicamente, para un tal 
operador lineal T, existe una base ortonormal de eigenvectores /3. Dado que 
las matrices que representan a T y T* en la base ordenada /3 son matrices 
diagonales, tales matrices conmutan; por lo tanto, la condición TT* >— T*T 
se hace necesaria para la existencia de tal base /3. Demostraremos que para 
espacios complejos con producto interior esta condición también es sufi- 
ciente. 

Definiciones. Sea V un espacio con producio interior, y sea T un operador lineal 
en V. Decimos que T es normal si TT* = T*T. Una matriz A de n x n es 
normal si AA* — A*A. 

Nótese que si (3 es una base ortonormal finita formada por eigenvec- 
tores de T, entonces T es normal si y sólo si [T]^ es normal. Por supuesto, 
cualquier matriz diagonal es normal. 

Si V no es dimensionalmente finito, entonces para que T sea normal 
es necesario que T* exista. 

Con el objeto de construir una base ortonormal de eigenvectores para 
un operador normal T, debemos demostrar primero que cualquiera de estos 
operadores tiene al menos un eigenvector. Para este resultado requeri- 
mos del siguiente teorema. 

Teorema 7.15. Sea V un espacio con producto interior, y sea T un operador 
norrnal en V. Entonces 

(a) ||T(x)|| = ||T*(x) j| para toda x£V. 

(b) T — cl es normai para toda c£F. 

(c) Si \ es un eigenvalor de T, entonces \ es un eigenvaîor de T*. 
De hecho, T(x) = Àx implica que T*(x) = Ax. 

(d) Si \i y \ 2 son distintos eigenvalores de T con eigenvectores co- 
rrespondientes x L y x 2 , entonces x x y x 2 son ortogonales. 

DEMOSTRACIÓN. 

(a) Para cualquier *ÇV, tenemos que 

|:T(jc) |I 2 = (T(jc),TU)) = (T*T(or), X) 

= (TT*(jt), x) = (T*U), T* (jc) ) = ||T* (jt) 11 2 . 

La demostración de (b) se deja como ejercicio. 
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(c) Sea U — T — Al y supóngase que T(x) = Ajc para alguna xÇV. 
Entonces U(x) — 0, y en virtud de (a) y (b) tenemos que 

0 = ||U(x)|| - ||U*W|| - ||(T* - Âl)(x)|| - ||T*(x) - Xjc||. 

Por lo tanto T*(x) = Lc. 

(d) Sean Ài y À 2 distintos eigenvalores de T con eigenvectores corres- 
pondientes x x y x 2 . Entonces, utilizando el inciso (c), tenemos que 

(*^l 5 ) (A]Xj, X 2 ) (T(Xj), ^"2) 

(xj, T (x^)) ~r (Xj, À 2 X 2 ) A 2 (xj, x^). 

Como à x ^Là 2 concluimos que (jc,, x 2 ) = 0. ■ 

Corolario 1 . Sea T un operador normal en un espacio con producto interior V, 
y sea P ana base ortonormal para V. Entonces /3 está jormada por eigen - 
vectores de T si y sólo si /3 está formada por eigenvectores de T*. 

Como se mencionó anteriormente, existe un fuerte paralelismo entre el 
complejo conjugado de un número complejo y el adjunto de un operador 
lineal. (Véase, por ejemplo, el Teorema 7.10.) Los números reales pue- 
den caracterizarse como aquellos números complejos que son iguales a sus 
complejos conjugados. Si consideramos la condición T = T* para un ope- 
rador lineal, veremos que se tienen muchas de las propiedades de los 
números reales para dichos operadores. De hecho, veremos (en el Ejer- 
cicio 5) que todo operador puede escribirse en la forma T, -f /T 2 , donde 
Ti y T 2 satisfacen la condición anterior. Asimismo, todos estos operadores 
tienen únicamente eigenvalores reales. 

Definiciones. Sea V un espacio con producto interior, y sea T un operador îineal 
en V. T se denomina operador autoadjunto (o Hermitiano) si T = T*. Una 
matriz A de n x n es autoadjunta (o Hermitiana) si A = A*. 

Así, para el caso de matrices reales, ser autoadjunta equivale a ser 
simétrica. 

Es fácil ver que si /3 es una base ortonormal finita para V, entonces T 
es autoadjunto si y sólo si [T]^ es autoadjunta. 

Nótese también que cualquier matriz diagonal que tenga al menos un 
elemento no real es normal pero no autoadjunta. Por supuesto, las matrices 
autoadjuntas son normales. 

Ejemplo 20. Sea V = R 2 ; entonces V = W,®W 2 , donde W, = L({(1, 
1)}) y W 2 = L({(0, 1)}). Sea T la proyección en W x tal que N(T) = W 2 ; 
esto es, T (a, b) = ( a , a). Si /3 = [e u e 2 ) y entonces 
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Dado que 



un cálculo sencillo muestra que AA* ^A*A. Así pues, T no es ni auto- 
adjunto ni normal. 

Veremos en la Sección 7.5 que un tipo especial de proyección T, llania- 
da “proyección ortogonal” (la que tiene la propiedad de que R(T) = N(T) 1 ), 
es siempre autoadjunta. 

Corolario 2. Sea T un aperador lineal auíoadjunto en un espacio con producto 
interior V. Si A es un eigenvalor de T, entonces A es un número reaL 

demostración. Sea x un eigenvector correspondiente al eigenvalor A. 
Por el inciso (c) del teorema anterior tenemos que 

Xx — T(jc) = T 1 *' (jc) = Ajc. 

Como x 0, tenemos que A = A; por lo tanto A es real. ■ 

En el Teorema 7.16 demostraremos que una cierta clase de operador 
lineal posee siempre un eigenvalor. 

E1 lector observará que las hipótesis de este teorema están divididas 
en dos casos, F == R y F = C. La razón de esto se hará evidente en el 
punto de la demostración donde deseemos obtener un cero del polinomio 
característico, ya que, aunque muchos polinomios de valor real no tienen 
ceros (reales), el teorema fundamental del álgebra (Apéndice D) garan- 
tiza este resultado para los polinomios de valor complejo. 

Teorema 7.16. Sea V un espacio vectorial dimensionalmente finito sobre F, 
y sea T un operador lineal en V. 

(a) Si V es un espacio vectorial complejo (esto es, si F = C), en- 
tonces T tiene un eigenvalor. 

(b) Si V es un espacio real con producto interior (o sea, si F — R) 
y T es autoadjunto, entonces T tiene un eigenvalor (real). 

demostración. Supongase que dim(V) = n, y sea / el polinomio carac- 
terístico de T. 

(a) Si F — C, entonces el teorema fundamental del álgebra garanti- 
za que / tiene un cero. Por tanto, T tiene un eigenvalor. 

(b) Si V es un espacio real con producto interior, sea /3 una base 
ortonormal para V. Entonces A — [T]p es autoadjunta y tiene elementos 
reales. 

Defínase a T Á : C n -> C n mediante T A (x) = Ax. De (a) se tiene que 
T i tiene un eigenvalor A. Como la matriz de T A en la base ordenada estárn 
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dar para C n es A, tenemos que T t es autoadjunto y, por lo tanto, según 
el Corolario 2 del Teorema 7.15, X es real. Luego entonces, el polinomio 
/(0 — det (A — tì) tiene el cero real X y entonces T tiene al eigenva- 
lor X . ■ 

Teorema 7.17(0. Sea V un espacio con producto interior , complejo y dimen - 
sionalmente finito, y sea T un operador lineal en V. Entonces T es normál 
si y sólo si V tiene una base ortonormal formada por eigenvectores de T. 

Teorema 7.17(R). Sea V un espacio con producto interior, real y dimensional- 
mente finito, y sea T un operador lineal en V. Entonces T es autoadjunto 
si y sólo si V tiene una base ortonormal formada por eigenvectores de T. 

demostración. Supondremos primero que T es o normal o autoadjunto 
y luego obtendremos la base ortonormal adecuada. La demostración se hará 
por inducción sobre n = dim(V). 

Si n= 1, entonces V = L({x}) para alguna x^LO. En este caso es 
obvio que ((1 /| |jc| | )jc} es una base ortonormal formada por un eigen- 
vector de T. 

Ahora supóngase que el resultado es cierto para operadores normales 
[autoadjuntos] en espacios con producto interior de dimensión n — 1. 
Demostraremos que el resultado es cierto para el operador T en V. 

Por el Teorema 7.16, T tiene un eigenvalor A,; sea jc, un eigenvector 
asociado. Supondremos que \\ x x \\ = 1. Sea W = L((jc,}). De acuerdo con 
el Teorema 7.15, jci es también un eigenvector de T*, de manera que evi- 
dentemente W es T- y T*-invariante. Por el Ejercicio 6, W x es también 
T- y T*-invariante; por tanto, por el mismo ejercicio, T w ^ es normal [auto- 
adjunto] puesto que T lo es. Del Corolario 2 del Teorema 7.6 tenemos 
que dim(W x ) = n — 1. Por lo tanto, podemos apíicar la hipótesis de induc- 
ción a T w ^ para producir una base ortonormal (x L >, . . . , x„} para W x 
formada por eigenvectores de T w ^ y, por lo tanto, de T. Se infiere fácil- 
mente es la base ortonormal para V deseada. 

La primera parte de la demostración, que es la más difícil, queda ter- 
minada. Ahora supongamos que (jc, , ... , x n } es una base ortonormal 
formada por eigenvectores de T con T(jCj) = X t : x-, para 1 < i < n. 

Si V es un espacio complejo con producto interior, entonces por el 
Teorema 7.15 

(TT*)(a,) = T^.r,) = XjOx-,.) = JìXìXì = | Xì\ 2 Xì para 1 < i < n. 
Análogamente, 

(T*T)(x;) = \Xì\ 2 Xì para !</<«. 


Por lo tanto, T es normal. 
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Por otra parte, si V es un espacio real con producto interior, entonces 
À* es real para 1 < / < n. Así, 

T(jcî) = kìXi = \ìXì = T*(jcì) para 1 < i < rt 

y, por lo tanto, T es autoadjunto. ■ 

Con el objeto de ver por qué la condición de normalidad en un espacio 
real con producto interior no es suficiente para garantizar ni siquiera un 
eigenvector, basta con que consideremos las rotaciones. Sea 0 < 6 < tt y 
defínase a T: R 2 -» R 2 como la rotación en un ángulo 6 . La matriz de T 
en la base ordenada estándar es 

Â __ (cosô —sen 8\ 

\sen0 cosOJ' 

Es fácil ver que AÂ* = I — A*A pero que A A*. Es geométricamente 
evidente que tal rotación no tiene eigenvectores. 

Concluiremos esta sección con un ejemplo de un operador normal en 
un espacio complejo con producto interior que ino tiene eigenvectores! 
Así pues, la hipótesis de que V sea dimensionalmente finito es crucial en 
el Teorema 7.17(C), así como en el Teorema 7.16. 

Ejemplo 21. Considérese el espacio con producto interior H anterior- 
mente definido, y sea x k — e ihr . Supóngase que V '= L({x k : k es un en- 
tero}). Evidentemente /? — (x*: k es un entero} es una base ortonormal 
de V. Selecciónense ahora operadores lineales T y U en V tales que 
J(x k ) — Xb+t y U(Xfc) = Xj^x para todo entero k . Entonces 

(T(xj), Xj) (Xj + i, Xj) 8(i+i >} 8j(j-i) 

= (xj, Xj-i) = (Xj, U(Xj)). 

Se infiere que U = T*. Además, TT* = I = T*T y entonces T es normal 
Para cualquier elemento x € V tenemos que 

k 

X = 2 GiXi 
i=-k 

para alguna k y escalares a h y entonces 

k 

\ T(x) = 2fliX i+1 . 

Como /? es independiente, se infiere que T no tiene eigenvectores. 

La condición de que TT* = I = T*T, la cual apareció en los últimos dos 
ejemplos, será considerada en la sección siguiente. 
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EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
los espacios con producto interior subyacentes son dimensionalmente finitos. 

(a) Todo operador autoadjunto es normal. 

(b) Los operadores tienen los mismos eigenvectores que sus adjuntos. 

(c) Si T es un operador en un espacio con producto interior V, entonces 
T es normal si y sólo si [T]p es normal, donde /3 es cualquier base 
ordenada para V. 

(d) Una matriz A es normal si y sólo si L Á es normal. 

(e) Los eigenvalores de un operador autoadjunto deben ser todos reales. 

(f) Los operadores identidad y nulo son autoadjuntos. 

(g) Todo operador normal es diagonalizable. 

(h) Todo operador autoadjunto es diagonalizable. 

2. Para cada uno de los siguientes operadores lineales, determinar si son 
normales, autoadjuntos o ninguno de Ios dos. 

(a) T: R 2 R 2 definido mediante T (a, b) = (2a - 26, -2a + 5b) 

(b) T: (7-^C 2 definido mediante T(a, b) = (2a + ib, a + 2 b) 

(c) yT: P 2 (/?) P 2 (/?) definido mediante T(/) = /'. 

Para el inciso (a), encontrar una base ortonormal para R 2 formada por 
eigenvectores de T. 

3. Sean T y U operadores autoadjuntos en un espacio con producto interior. 
Demostrar que TU es autoadjunto si y sólo si TU'— UT. 

4. Demostrar el inciso (b) del Teorema 7.15. 

5. Sea V un espacio complejo con producto interior, y sea T un operador lineal 
en V. Defínase 

Ti=L(T + T*) y T 2 = L(T-T*). 

(a) Demostrar que Tj y T 2 son autoadjuntos y que T — T, + /T 2 . 

(b) Suponer también que T = U^ + /U 2 , donde U, y U 2 son autoadjuntos. 

Demostrar que U, = T, y U 2 = T 2 . 

(c) Demostrar que T es normal si y sólo si T,T. = T 2 T,. 

6. Sea T un operador lineal en un espacio con producto interior V, y sea W 
un subespacio T-invariante de V. Demostrar las cuestiones siguientes. 

(a) Si T es autoadjunto, entonces también T w lo es. 

(b) \N l es T*-invariante. 
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(c) Si W es T- y T*-invariante, entonces (T w )* = (T*) w . 

(d) Si W es T- y T*-invariante y T es normal, entonees T w es normal. 

7. Sea T un operador normal en un espacio complejo con producto interior 
dimensionalmente finito V, y sea W un subespacio de V. Demostrar que si 
W es T-invariante, entonces W es también T*-invariante. Sugerencia: Utili- 
zar el Ejercicio 10(d) de la Sección 5.4. 

8. Sea T un operador normal en un espacio con producto interior dimensio- 
nalmente finito V. Demostrar que N(T) — N(T*) y R(T) = R(T*). Suge - 
rencia: Utilizar el Teorema 7.15 y el Ejercicio 12 de la Sección 7.3. 

9. Sea T un operador autoadjunto en un espacio con producto interior dimen- 
sionalmente finito V. Demostrar que para toda rÇV 

|íT (x) ±ìjc||*= ||T(jc)||*+ ||jc||*. 

Deducir que (T — /I) es invertible y que [(T — /I) 1 ]* = (T + /I) -1 . 

10. Supóngase que T es un operador lineal en un espacio complejo con producto 
interior (no necesariamente dimensionalmente finito) V con un adjunto T*. 
Demostrar que 

(a) Si T es autoadjunto, entonces (T(x), x) es real para toda jcÇV. 

(b) Si T satisface a (T(*), x) = 0 para toda ;cÇV, entonces T = T 0 . 
Sugerencia: Sustituir a x por x + y y luego por x + iy y expándan- 
se los productos interiores resultantes. 

(c) Si (T(*), x) es real para toda jc£V, entonces T = T*. 

11 . Sea A una matriz real de n x n. Se dice que A es una matriz Gramiana si 
existe una matriz real B (cuadrada) tal que A = B f B. Demostrar que A 
es una matriz Gramiana si y sólo si A es simétrica y todos sus eigenvalores 
son no negativos. Sugerencia: Aplicar el Teorema 7.17(7?) a L* para 
obtener una base ortonormal {jc,, . . . , x n ) de eigenvectores con los eigen- 
valores asociados \ u ... , \ n . 

12. Sea T un operador autoadjunto en un espacio con producto interior n- di- 
mensional V, y sea A — [T]^, donde /? es una base ortonormal para V. 
Se dice que T es definido [semidefinido] positivo si (T(x), x) > 0 para toda 
x^zO [(T(*), x) > 0 para toda x]. Demostrar 

(a) T es definido [semidefinido] positivo si y sólo si todos sus eigenvalores 
son positivos [no negativos]. 

(b) T es definido [semidefinido] positivo si y sólo si l A también lo es. 

(c) T es definido positivo si y sólo si 

2 A ija t aj > 0 para todas las n-adas no nulas (a,, . . . , a n ). 
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(d) T es semidefinido positivo si y sólo si A es una matriz Gramiana (tal 
como se definió en el Ejercicio 11). 

La composición de dos operadores definidos positivos ^es definido positivo? 

13. Diagonalizaciórï simultánea. 

(a) Sea V un espacio con producto interior, real y dimensionalmente fini- 
to, y sean U y T operadores autoadjuntos en V tales que UT = TU. 
Demostrar que existe una base ortonormal para V formada por vec- 
tores que son eigenvectores de U y de T. (La versión compleja de 
este resultado aparece como el Ejercicio 10 de la Sección 7.9.) Suge- 
rencia: Para cualquier eigenespacio W = Ex de T tenemos que W 
es T- y U-invariante. Por el Ejercicio 6 tenemos que \N L es T- y U-in- 
variante. Aplicar el Teorema l.ll(R) y el Teorema 7.6. 

(b) Enunciar y demostrar los resultados análogos acerca de matrices si- 
métricas (reales) conmutativas. 

14. Sea T un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Demostrar lo siguiente. 

(a) Si p = {x u . . . , jc n ) es una base ordenada para V, entonces [T]p es 
triangular superior si y sólo si T(* ; ) £L({x u ... , *,}) para / = 
= 1, • • • , n. 

(b) Si V es un espacio complejo con producto interior, entonces existe 
una base ortonormal y para V tal que [T] r es triangular superior. 
Sugerencia: Utilizar inducción sobre n — dim(V). Escójase un eigen- 
vector x de T* y sea W = L((jc}). Aplíquese la hipótesis de induc- 
ción a que, de acuerdo con el Ejercicio 6(b), es T-invariante. 

(c) Toda matriz compleja A es similar a una matriz triangular superior. 

15. Demostrar el teorema de Cayley-Hamilton para una matriz compleja A de 
n x n ; esto es, si / es el polinomio característico de A , demostrar que 
f(A ) — 0. Sugerencia: De acuerdo con el inciso (c) del Ejercicio 14, 
demostrar que es posible suponer que A es triangular superior, en cuyo caso 

m = rì ti -'). 

i= 1 

Ahora bien, si T — L 4 , tenemos que (Aj } \ T) ( x } ) ÇL({r h . . . , *;-i}), 
donde {x u . . . , x n ) es la base ordenada estándar para C n . 


7.6* EL CONDICIONAMIENTO Y EL COCIENTE DE RAYLEICH 

En la Sección 3.4 estudiamos técnicas específicas que nos permitieron re- 
solver sistemas de ecuaciones lineales de la forma AX ~ b donde A es 
una matriz de m x n y b es un veetor de m x 1. Tales sistemas surgen 
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a menudo en las aplicaciones a la vida real. Los coeficientes del sistema 
se obtienen a partir de datos experimentales y en muchos casos m y n 
son tan grandes que es necesario utilizar una computadora para obtener 
la solución. Así pues, debemos considerar dos tipos de errores. Primero, 
hay errores experimentales que surgen en la recopilación de la información 
puesto que ningún instrumento puede permitir realizar medidas totalmente 
exactas. Segundo, las computadoras introducirán errores de redondeo. In- 
tuitivamente se puede sentir que cambios relativamente pequenos en los 
coeficientes del sistema provocarán errores relativamente pequenos en la 
solución. Un sistema que tiene esta propiedad se denomina bien condicio - 
nado; de lo contrario el sistema se llama pobremente condicionado. 

Consideraremos ahora algunos ejemplos de estos tipos de errores, con- 
centrándonos principalmente en los cambios en b más bien que en los 
cambios de los elementos de A. Además, supondremos que A es cuadrada, 
compleja (o real) e invertible puesto que este es el caso que se encuentra 
con más frecuencia en las aplicaciones. 

Ejemplo 22. Considérese el sistema 

J Xi + x 2 = 5 

t* 1 . 

La solución del sistema será 



Ahora supóngase que cambiamos un poco al sistema y considérese el nue- 
vo sistema 

ÍXi + x-> = 5 

t x, — x> = 1.0001. 

Este sistema modificado tiene la solución 

/3.00005\ 
v 1.99995 )' 

Vemos que una modificación de 10 -4 en uno de los coeficientes ha modi- 
ficado en menos de 10 4 a cada una de las coordenadas de la nueva 
solución. Más generalmente, el sistema 

j x, + x, - 5 

t^i — x> — 1 + 8 



tiene como solución a 
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Por lo tanto, pequenos cambios en b introducen pequenos cambios en la 
solución. Por supuesto, estamos realmente interesados en los “cambios 
relativos puesto que un cambio en la solución de, por ejemplo, 10 se 
considera grande si la solución original es del orden de 10 2 pero pequeno 
si la solución original es del orden de 10 r '. 


Introduciremos la notación Sb para representar al vector b' — b , donde 
b es el vector del sistema original y b' es el vector del sistema mod'ificado. 
Así, en el Ejemplo 22, tenemos que 


Sb = 



Definiremos ahora el cambio relativo en b como el escalar !j Sb \/ b , 
dond e j! • | j denota la norma estándar en C" (o R n ); esto es i!b "i= 
— V (b, b). La mayor parte de Io que sigue, sin embargo, es cierto para 
cualquier norma. Definiciones semejantes se cumplen para el cambio rela- 
tivo en *. Así, en el Ejemplo 22, 


Pll ~V26 



De manera que el cambio relativo en x es igual, coincidentemente, al 
cambio relativo en b y, por Io tanto, el sistema está bien condicionado. 


Ejemplo 23. Considérese el sistema 

J x > + x-. = 3 

\*i + 1.00001*2 = 3.00001, 

el cual tiene a 

como solución. La solución para el sistema relacionado 

j JT, + x 2 = 3 

+ 1.00001 x 2 = 3.00001 + S 

es 


(2 - (I0")S\ 

\1 + (10 r )s; 


ILM 

11*11 


= ( v f)10 s |<5|>10<|<5|, 


Por Io tanto, 
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mientras que 


!|M>II_ 'M 

Nfcj! ~ 5' 

Tenemos que el cambio relativo en x es al menos ;10 4 veces el cambio 
relativo en b\ E1 sistema está muy pobremente condicionado. Obsérvese 
que las líneas rectas definidas por las dos ecuaciones de este sistema son 
casi coincidentes, de modo que una pequena modificación en cualquiera 
de las rectas alteraría en gran medida el punto de intersección, esto es, 
la solución del sistema. 


Para aplicar toda la fuerza de la teoría de las matrices autoadjuntas 
al estudio del condicionamiento, necesitamos tener la noción de norma de 
una matriz. (Ver Ejercicio 22 de la Sección 7.1 para otros resultados 
sobre normas.) 


Definición. Sea A una matriz compleja (o real) de n x n. Defínase la norma 
(Euclidiana) de A mediante 


donde x £C n (o R n ). 


|| A|| = max 

x*0 


11 Axj | 

jlx'j 


Vemos intuitivamente que ||/4|j representa la “ampliación máxima de 
un vector mediante la matriz A. 

La cuestión si este máximo existe o no, así como el problema de 
cómo calcularlo, serán resueltO'S por medio del llamado “cociente de Ray- 
leigh”. 


Definición. Sea B una matriz autoadjunta de n x n. El cociente de Rayleigh 
para x^O se define como el escalar R(x) = (Bx, x)/jjx|| 2 . 


Teorema 7.18. Para una matriz autoadjunta B tenemos que mR(x) es el 

X * 0 

mayor eigenvalor de B y min R(x) es el mínimo eigenvalor de B. 

X * o 

demostración. Por el Teorema 7.17 podemos seleccionar una base orto- 
normal {jc,, ... , jc m } de eigenvectores de B taîes que Bx, — V x iy 1 < 
< / < «, donde A, > > . . . > X n . (Recuérdese que, por el Corolario 2 

del Teorema 7.15, los eigenvalores de B son reales.) Ahora bien, para 
a£C u (o R n ) existen escalares a x , . . . , a„ tales que 

n 

x = 2 a < x >\ 


i 1 
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por lo tanto 


R(x) 


( Bx y x) a j x j j I a ì h !*■ 


l-vll z 


Es fácil ver que /£(*!) = X, por lo que, con esto, hemos demostrado 
la primera mitad del teorema. La segunda mitad se demuestra de una 
manera semejante. ■ 


Corolario 1. Para cualquier matriz cuadrada A, : 'Ajj es finita y, de hecho , es 
igual a V À, donde X es el mayor eigenvalor de A*A. 

DEMOSTRACiÓN. Sea B la matriz autoadjunta A*A, y sea A el mayor eigen- 
valor de B. Como, para jc^O, 


0 <r II Ax \\ 2 _ ( Ax , Ax ) _ (A*Ax, x) ( Bx, x) 

“ imi 2 ikii 2 _ iuii 2 

tenemos del Teorema 7.18 que \\A\\* = \. ■ 


= R(x), 


Obsérvese que la demostración del Corolario 1 muestra que todos los 
eigenvalores de A*A son no negativos. Para el siguiente corolario nece- 
sitamos del lema siguiente. 


Lema. Para cualquier matriz cuadrada A, A es un eigenvalor de A*A si y sólo 
si X es un eigenvalor de AA*. 

demostración. Sea À un eigenvalor de A*A. Si À = 0, entonces A*A 
no es invertible. Por lo tanto, A (y A*) no es invertible, de manera que 
À es también un eigenvalor de AA*. La prueba de Ia recíproca es se- 
mejante. 


Supóngase ahora que À^O. Entonces existe x^O tal que A*Ax — 
= Aplicando A a ambos lados tenemos que (AA*)(Ax) = X(Ax). 
Como Ax =/= 0 (pues de lo contrario Xx = 0), tenemos que À es un eigen- 
valor de AA*. La recíproca se deja como ejercicio. ■ 

Corolario 2. Sea A una matriz invertible. Entonces ! IA~ 1 j j = 1/yT, donde X 
es el eigenvalor mds pequeho de A*A. 

demostración. Haremos uso de Ia observación de que À es un eigen- 
valor de una matriz invertible si y sólo si À _1 es un eigenvalor de su 
inversa. 


Ahora bien, sean X t > À 2 > ... > À /( los eigenvalores de A*A, los 
cuales, por el lema, son los eigenvalores de AA*. Entonces A 1 - es igual 
al mayor eigenvalor de (A ')*A ' = (AA*y\ el cual es igual a’l/À ( , " ■ 
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Para muchas aplicaciones, únicamente los eigenvalores mayor y menor 
son de interés. Por ejemplo, en el caso de los problemas de vibración, el 
eigenvalor más pequeno representa la mínima frecuencia a la que las vibra- 
ciones pueden ocurrir. 

Veremos el papel de ambos eigenvalores en nuestro estudio de condi- 
cionamiento. 


Ejemplo 24. Sea 


Entonces 

B = A*A = |-1 
1 

Los eigenvalores de B son 3, 3 y 0. Por tanto, ||/1|] = Para cualquier 

' _ (:H 

podemos calcular R(x) para la matriz B como 

( Bx, x) _ 2(<r + fr 2 + c 2 - ab + ac + bc) 



3 > R(x) 


à- + b- + c- 


para toda a, b, c£R. 


Ahora que sabemos que A‘ t existe para toda matriz cuadrada, utiliza- 
remos 1a desigualdad ||/ljt|| < ||/i|| • \\x\\, la que se cumple para toda a:. 

Supóngase, para lo que sigue, que A es invertible, b =£0 ỳ Ax — b. 
Para una 8 b dada, sea Sx el vector que satisface a A (* + Sj:) = b + Sb. 
Entonces /í(Sx) = Sb, y así Sx = A-'(8b). Por lo tanto, 

p|| = |Mx||<!M!|.||x|| y ||<5x|| = IM~ , (<5f>)ll ^ \\A~' IMI<5(>||. 


Así, tenemos que 

||x|| ^ ||6|| 11 11 11 11 \\\b\\ 

De una manera análoga, 

1 (\\ôb\\\^\\5x\\ 

IMIMM -1 II v Pll / “ 11*11 ' 


E1 número ||/l|| • ||/4"'l| se llama número condicional de A y se denota 
por coiui(A). Debe hacerse notar que la definición de cond(/l) depende 
de cómo definimos la norma de A. Existen muchas maneras razonables de 
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definir la norma de una matriz. De hecho, la única propiedad que utili- 
zamos para establecer las desigualdades anteriores fue que <\Ax |j < !|/í|j 
! ’ !! *!i P ara toda x. Resumamos lo anterior con el teorema siguiente. 


Teorema 7.1 9. Para el sistema Ax - b donde A es invertible }/ b^O, tene - 
mos ìos dos resultados siguientes: 


(a) 


1 |!<$b j 

cond (A) j|b|| 


< 


\r~jr ^ cond(A) (para cualquier norma I 


(b) cond(A) — donde X x y X 2 son los eigenvalores mayor y 

rnenor, respectivamente, de A*A. (En este inciso suponemos que 
!! * |j es la norma Euclidiana, definida en esta sección.) 


demostración. E1 enunciado (a) se obtiene de las desigualdades ante- 
riores y el (b) de los Corolarios 1 y 2 del Teorema 7.18. ■ 


Del Teorema 7.19 es claro que cond(/l) > 1. Se deja como ejercicio 
demostrar que cond(/l) = 1 si y sólo si A es un múltiplo escalar de una 
matriz “unitaria” u “ortogonar’, definida en la Sección 7.7. Además, pue- 
de demostrarse con algo de trabajo que en el inciso (a) se puede obtener 
la igualdad mediante una elección adecuada de b y Sb. 

Podemos darnos cuenta de inmediato del inciso (a) que si cond(/l) 
se aproxima a 1, entonces estamos seguros que un error relativo pequeno 
en b obliga a un error relativo pequeno en jc. Si cond(/l) es grande, sin 
embargo, entonces el error relativo en x puede ser pequeno, aun cuando 
el error relativo en b sea grande, o bien el error relativo en x puede ser 
grande, jaun cuando el error relativo en b sea pequeno! En pocas palabras, 
cond(/l) indica únicamente el potencial para errores relativos grandes. 

Hasta ahora hemos considerado únicamente errores en el vector b. Si 
existe un error 8A en la matriz de los coeficientes del sistema AX = b , 
la situación es más complicada. Por ejemplo, A + 8A puede dejar de ser 
invertible. Pero puede demostrarse bajo consideraciones adecuadas que se 
puede dar una cota para el error relativo en x en términos de cond(/4). 
Por ejemplo, si A + 8A es invertible, Forsythe y Moler (Forsythe, George 
y Moler, Cleve B., Computer Solution of Liner Algebraic Systems, Pren- 
tice Hall, Inc., 1976, p. 23), demuestran que 


jlgfjj 

!> + 8x\\ 


< cond(/l) 


iMl 

'\AW - 


Debería mencionarse que, en la práctica, casi nunca se conoce cond(/l), 
puesto que sería un gasto innecesario de tiempo calcular A' 1 simplemente 
para determinar la norma. De hecho, si se utiliza una computadora para 
encontrar A \ la inversa de A así calculada únicamente se aproximará a 
A 1 y el error en la inversa calculada se verá afectado por la magnitud 
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de cond(/4). jY así caemos en un círculo vicioso! Existen, sin embargo, 
algunas situaciones en las cuales se puede encontrar una aproximación 
utilizable de cond(y4). Así pues, en la mayor parte de los casos, la esti- 
mación del error relativo en x se basa en la estimación de cond(/i). 


EJERCICIOS 


1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Si AX ~ b está bien condicionada, entonces cond(/4) es pequeno. 

(b) Si cond(/j) es grande, entonces AX = b está pobremente condicio- 
nada. 

(c) Si cond(/l) es pequeno, entonces AX — b está bien condicionada. 

(d) La norma de A es igual al cociente de Rayleigh. 

(e) La norma de A es siempre igual al mayor eigenvalor de A. 


2 . Calcular las normas de las matrices siguientes. 


3 . 

4 . 


(a) 

(c) 


C ï) 


(b) 


(-ï 3) 


-2 

-2 

7T 

2 


Demostrar que si B es simétrica, entonces 
de B. 

Sean A y A ' las siguientes: 


A = 


B !] es el mayor eigenvalor 


6 

13 


/ 6 

-4 

13 

29 

-38 

y A -> = ( -4 

11 

17 

-38 

50/ 

\-l 

7 


7 5/ 


Los eigenvalores de A son aproximadamente 84.74, 0.2007 y 0.0588. 


(a) Aproximar -;A , A y cond (A). (Obsérvese el Ejercicio 3 ante- 
rior.) 

(b) Supóngase que tenemos vectores x y x tales que Ax ~ b y \\b — Ax 

<0.001. Utilizar (a) para determinar las cotas superiores para 
■\x ~ A~ ] b (el error absoluto) y |!v - A-'b\\/\\A~'b :: (el error rela- 
tivo). 


5 . Supóngase que ar es la verdadera solución de AX = b y que una computado- 
ra llega a una solución aproximada .v. Si cond(/í) = 100, b \ = I y b — 
- Ax'il = 0.1, obtener cotas superior e inferior para !jc — x ' ! /Nx 
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Sea 


Calcular 



R 



||B|| y cond(S). 


Sea B una matriz simétrica. Demostrar que min/?(x) es igual al eigenva- 

j‘' <> 

lor más pequeíïo de B. 


Demostrar que si X es un eigenvalor de AA *, entonces X es un eigenvalor 
de A*A. Esto completa la demostración del Jema del Corolario 2 del 
Teorema 7.18. 


Demostrar la desigualdad izquierda de (a) en el Teorema 7.19. 


Demostrar que condM) — 1 si y sólo si A es un múltiplo escalar de una 
matriz unitaria u ortogonal, tal como ésta se define en la Sección 7.7. 


(a) Sean A y B matrices cuadradas unitariamente equivalentes, tal como 
se definen en la Sección 7.7. Demostrar que \\A\\ — 

(b) Sea V un espacio con producto interior dimensionalmente finito, y sea 
T un operador lineal en V. Defínase 


Demostrar que ||T ■ — j [T]^ j, donde /3 es cualquier base ortonormal 
de V. 

(c) Sea V un espacio dimensionalmente finito con producto interior y con 
una base ortonormal (x,, x_>, . . .}. Sea T el operador lineal en V tal 
que T(.fy) kx]ç. Demostrar que j|Tj; (definido en (b)) no existe. 


OPERADORES UNITARIOS Y ORTOGONALES 
Y SUS MATRICES 

En esta sección continuaremos nuestra analogía entre los números comple- 
jos y los operadores lineales. Recordemos que el complejo conjugado de 
un número complejo actúa de una manera semejante al adjunto de un 
operador lineal. (Véase, por ejemplo, el Teorema 7.10.) Un número com- 
plejo z tiene una longitud de 1 si zz — 1. En esta sección estudiaremos 
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a aquellos operadores lineales T en un espacio vectorial V tales que TT* — 
— y*T = I. Veremos que éstos son justamente los operadores lineales que 
“preservan la longitud” en el sentido de que ||T(jc)jj — jjjcjj para toda 
xÇV. También demostraremos que, en un espacio complejo con producto 
interior, dimensionalmente finito, éstos son los operadores normales cuyos 
eigenvalores tienen todos un valor absoluto de 1. 

En capítulos anteriores estuvimos interesados en estudiar aquellas fun- 
ciones que conservan la estructura del espacio subyacente. En particular, 
los operadores lineales conservan las operaciones de suma vectorial y de 
multiplicación por escalares y los isomorfismos conservan toda la estruc- 
tura del espacio vectorial. Es ahora normal considerar aquellos operadores 
lineales T en un espacio con producto interior que conservan la longitud; 
es decir, UT(jc)J[ - \\x\'' para toda j:. Veremos que, de hecho, esta condi- 
ción garantiza que T preserva el producto interior. 

Definiciones. Sea V un espacio con producto interior (sobre F), y sea T un ope - 
rador lineal en V. Si j|T(x);| & jjxlj para toda xÇV, llamamos a T un 
operador unitario si F = C y un operador ortogonal si F = R. 

Evidentemente, cualquier rotación o reflexión en R- preserva la longi- 
tud y, por lo tanto, es un operador ortogonal. Estudiaremos en la próxima 
sección a estos operadores con mucho más detalle. 

Ejemplo 25. Sea V = H y sea h Ç_ V con \h(x)\ = 1 para toda Defínase 
a T: V-^V mediante T(/) = hf. Entonces 

||T(/) j| 2 = \\hfr = Y f h(t)f(t)h(t)f (t)dt m ||/j|- 

por el hecho de que \h(t)r - I para toda /. Por tanto, T es un operador 
unitario. 

Teorema 7.20. Sea V un espacio con producto interior , dimensionalmente finito , 
y sea T un operador lineal en V. Entonces son equivalentes las siguientes 
condiciones. 

(a) TT* = T*T = I. 

(b) (T(x), T(y)) = (x, y) para toda x, y ÇV. 

(c) Si [ì es una base ortonormal para V, entonces T(/3) es una base 
ortonormal para V. 

(d) Existe una base ortonormal para V tal que T(/3) es una base 
ortonormal para V. 

(e) 'T(x) = x para toda xÇV. 

Por lo tanto, todas las condiciones anteriores son equivalentes a la defi- 
nición de un operador unitario u ortogonal. De (a) se deduce que todo 
operador unitario u ortogonal es normal. 
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Antes de probar el teorema, primero demostraremos el siguiente lema. 
Compárese éste con el Ejercicio 10(b) de la Sección 7.5. 

Lema. Sea V un espacio con producto interior , dimensionalmente finito, y sea 
U un operador autoadjunto en V. Si (x, U(x)) = 0 para toda x Ç V, enton- 
ces U = T 0 . 

demostración. Por el Teorema 7.17 podemos escoger una base ortonor- 
mal p de eigenvectores de U. Si x£f3 entonces U(x) — \x para alguna \. 
Entonces 


0 = (*, U(x) ) = (x , \x) = \(x , x), 

y Â — 0. Por lo tanto, U(x) = 0 para toda x y, finalmente, U = T 0 . ■ 

demostración del teorema 7.20. Primero demostraremos que (a) im- 
plica a (b). 

Sea x, y<EV. Entonces (x, y) = ((T*T)(x), y) = (T(jc), T(y)). 

En segundo lugar, demostraremos que (b) implica a (c). Sea fi = 
= {x,, . . . , x„ } una base ortonormal para V. Entonces T (fi) = {T(x,). 
. . . , T(x„)}. Ahora bien, (T(jri), T(jc,)) = (jc„ *,) = 8,,-. Así, T (fi) es 
una base ortonormal de V. 

E1 que (c) implica a (d) es evidente. 

Ahora demostraremos que (d) implica a (e). Sea *£V y sea /3 = 
= {JCi, ... , *„}. Tenemos que 


x = 2 <*ìXì 

i : 1 

para algunos escalares a t y entonces, como /3 es ortonormal, 

11*11 ís a í x i> s a j x j \ ~ s s a i a j( x i> x j ) = s a i a jàij — i i 

/ í = i y = i x~i y= ì ,= i 


Haciendo las mismas operaciones a 

T(-ï) - 2 aJ(jfi) 

i - 1 

y utilizando el hecho de que T (/3) también es ortonormal, obtenemos 

!| TU )|| 2 = 2 

i i 

Por tanto ' T(jc) ! = ||jcj|. 

Finalmente, demostraremos que (e) implica a (a). Para cualquier 
x £ V tenemos que 

(JT, AT) = !|*!p= ||T(JC)||*= (T(JC), T(JC)) = (x, (T*T) (x )). 
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Así, (x, (I - T*T)(jc)) - 0 para toda xÇV. Sea U = I - T*T; entonces 
U es autoadjunta y ( x, U(jc)) = 0 para toda xÇV. Luego, de acuerdo con 
el lema, tenemos que T« = U — I — T*T y por lo tanto T*T = I. Así pues, 
como V es dimensionalmente finito, T* = T _1 y entonces TT* = I. ■ 

De la definición se infiere directamente que el valor absoluto de todo 
eigenvalor de un operador unitario u ortogonal es 1. De hecho, algo más 
es cierto. 

Corolario 1. Sea T un operador lineal en V un espacio real dimensionalmente 
finito con producto interior. V tiene una base ortonormal de eigenvectores 
de T con eigenvalores correspondientes de valor absoluto 1 si y sólo si T 
es autoadjunto y ortogonal. 

demostración. Supóngase que V tiene una base ortonormal {*i, . • • , * n ) 
tal que T(jcí) = Xix-, y |A { | = 1 para toda i. Por el Teorema 7.17(K), T 
es autoadjunto. Entonces (TT*)(x f ) = T(A/X,) = A/A.x, = A?x f = x f para 
cada i, de modo que TT* = I y por el inciso (a) del Teorema 7.20, T es 
ortogonal. 

Si T es autoadjunto, entonces por el Teorema 7.17(R) tenemos que V 
posee una base ortonormal {x,, . .. , x M ) tal que T(Xj) = ÀiX* para toda /. 
Como T es ortogonal, tenemos que |A,| • \\xi\\ — HA/X/H = ||T(x,)|| = ||x,||, 
y entonces |A,| = 1 para cada /. ■ 

Corolario 2. Sea T un operador lineal en V un espacio complejo dimensional - 
mente finito con producto interior. Entonces, V tiene una base ortonormal 
de eigenvectores de T con eigenvalores correspondientes cuyo valor abso- 
luto es 1 si y sólo si T es unitario. 

demostración. La demostración es semejante a la del Corolario 1. ■ 

Ejemplo 26. Sea T: R 2 —> R 2 una rotación por 0, donde 0 < 0 < 77 . Es 
geométricamente evidente que T “preserva la longitud”, esto es que | T(x)|| 
M = j |jcj | para toda x£R‘ j . E1 hecho de que las rotaciones por un ángulo 
fijo conservan la perpendicularidad no sólo puede verse geométricamente, 
sino que ahora se infiere del inciso (b) del Teorema 7.20. Probablemente 
el hecho de que tal transformación preserve el producto interior no sea tan 
evidente geométricamente; sin embargo, este hecho Io obtenemos también 
a partir de (b). Finalmente, una inspección de la matriz 

/cos 0 — sen 0\ 

V sen 0 cos 0) 

revela que T no es autoadjunto para la restricción dada para 0. Como ya 
lo mencionamos anteriormente, este hecho también se infiere de la obser- 
vación geométrica de que T no tiene eigenvectores y del Teorema 7.16. 
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Puede verse fácilmente de la matriz anterior que T* es una rotación por 

-o. 

Ahora, examinaremos a las matrices que representan transformaciones 
unitarias y ortogonales. 

Definiciones. Supóngase que A es una matriz de n x n que satisface a AA* = 
— A*A — I. Llamamos a A matriz unitaria si tiene elemeníos complejos, 
y la llamamos matriz ortogonal si tiene elementos reales. 

Nótese que la condición AA* = / e s equivalente a afirmar que los ren- 
glones A,, . . . , A n de A forman un conjunto ortonormal en P para 

~ hj = (AA*),j = A lk (A*) kJ = ^j£ A ik A ]k = (A„ Aj). 

Puede hacerse una observación semejante acerca de las columnas de A 
y de la condición A*A = /. 

Se infiere también de la definición anterior que si V es un espacio 
c°n producto interior y T es un operador lineal en V, entonces T es unitario 
[ortogonal] si y sólo si [T]^ es unitaria [ortogonal] para alguna base orto- 
normal /? de V. 

Ejemplo 27. La matriz 

/'cosO — sen0\ 

\sen 0 cos 6 J 

es claramente ortogonal. Se puede ver fácilmente que los renglones de la 
matriz forman un conjunto ortonormal en R 2 . 

Sabemos que para una matriz normal compleja A [autoadjunta real] 
existe una base ortonormal /? para F" formada por eigenvectores de 
A. Por lo tanto, A es similar a una matriz diagonal D. Por el Teorema 5.1, 
Ia matriz Q, cuyas columnas son los vectores de /3, es tal que D = Q 'AQ. 
Pero como Ias columnas de Q son una base ortonormal para F n se infiere 
que Q es unitaria [ortogonal]. En este caso decimos que A es unitariamente 
equivalente [ortogonalmente equivalente ] a D. Se ve fácilmente (ver Ejer- 
cicio 17), que esta relación es una relación de equivalencia en M n><n (C) 
[M nxn (/?)]. Más generalmente, A y B son unitariamente equivalentes [or- 
togonalmente equivalentes], si y sólo si existe una matriz unitaria [ortogo- 
nal] P tal que A = P*BP. 

E1 párrafo anterior ya ha demostrado la mitad de cada uno de los 
dos siguientes teoremas. 

Teorema 7.21(0. Sea A una matriz compleja de n x n. Entonces A es normal 
si y sólo si A es unitariamente equivalente a una matriz diagonal. 

Teorema 7.21 (R). Sea A una matriz real de n y n. Entonces A es avtoadjunta 
si y sólo si A es ortogonalmente equivalente a una matriz real iìagonal. 
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demostración. Por las observaciones anteriores, necesitamos demostrar 
únicamente que si A es unitariamente [ortogonalmente] equivalente a una 
matriz diagonal, entonces A es normal [autoadjunta]. 

Supóngase que A — P*DP , donde P es una matriz unitaria y D es una 
matriz diagonal. Entonces AA*= (P*DP) (P*DP)* = (P*DP) (P*D*P) = 
= P*DID*P = P*DD*P. 

Análogamente A*A = P*D*DP . Como D es una matriz diagonal, sin 
embargo, tenemos que DD* = D*D. Entonces AA* — A*A. 

E1 resto de la demostración se deja al lector. ■ 

Ejemplo 28. Sea 



entonces A = A*. Los eigenvalores de l A son Ai = 5 y À 2 — — 5. Corres- 
pondientes a cada uno de estos eigenvalores están los eigenvectores y x = 
— (-2, 1) y y 2 = (1, 2). Como se esperaba, y y 2 son ortogonales. 
Sean 


Xi -=r( — 2, 1), x 2 - p=( 1 j 2) y p {jCi, x 2 }. 

V5 V5 

Entonces, p es una base ortonormal de eigenvectores de L A . Como en el 
párrafo que precede al Teorema 7.21, sean 

2 »°=(o -?> 

V 5 

Un cálculo sencillo muestra que P*AP = D. 


-2 



V 5 


Una aplicación (secciones cónicas) 

Como una aplicación del Teorema 7.21, consideremos la ecuación cua- 
drática 

ax 2 + 2bxy + cy 2 + dx + ey + / = 0. (12) 

Para elecciones especiales de los coeficientes de la ecuación (12), obte- 
nemos las distintas secciones cónicas. Por ejemplo, si a = c = 1, b — d = 
= e = 0 y f = — 1 , obtenemos la ecuación de la circunferencia x 2 + y 2 = 
— 1 con centro en el origen. Las secciones cónicas restantes, llamadas elip- 
se, parábola e hipérbola, se obtienen mediante otra selección de coeficientes. 
La ausencia del término xy permite graficar fácilmente estas cónicas me- 
diante el método de completar el cuadrado. Por ejemplo, x 2 + 2x + y 2 + 
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+ 4y 4* 2 = 0 puede reescribirse como (jc + 1 ) a + (y + 2)- = 3, que 
es la ecuación de una circunferencia con centro en (— 1, — 2) en el sistema 
de coordenadas cartesiano (jc, y) y con radio V3. Si consideramos la 
transformación de coordenadas (jc, y) —> (jc', y'), donde jc' = jc + 1 y 
y' = y + 2, entonces nuestra ecuación se simplifica a (jc')- + (y')~ = 3. 
Este tipo de transfÔrmación (llamada translación) nos permite eliminar los 
términos en jc y en y. 

Ahora, nos concentraremos únicamente en la eliminación del término 
en jcy. Para hacer esto consideremos la expresión 

ojc 2 + 26jcy + cy J , (13) 

la que se denomina forma cuadrática asociada de la ecuación (12). Las 
formas cuadráticas serán estudiadas con más detalle en la Sección 7.11. 
Si hacemos 



entonces la ecuación (13) puede reescribirse como X f AX = ( AX , X ). 
Por ejemplo, 3x 2 + 4jcy + 6y puede escribirse como 



E1 hecho de que A sea autoadjunta es crucial en nuestra exposición, 
puesto que, en virtud del Teorema 7.21, podemos escoger una matriz orto- 
gonal P y una matriz diagonal D con elementos reales en la diagonal 
\ v y À 2 , tales que P l AP — D. Ahora definamos a 



mediante X' = P ( X o, de manera equivalente, mediante PX' — PP'X — X. 
Entonces 

X'AX = (PXJA(PX') = X'‘(P‘AP)X' = X'‘DX' = X^x') 1 + X 2 (y')\ 

Así, la transformación ( x , y) —» (j:', y') nos permite eliminar al término en 
xy en la ecuación (13) y, por lo tanto, en la ecuación (12). 

Además, como P es ortogonal, tenemos, de acuerdo con el Ejercicio 
20(c), que det(P) = ±1. Si det(P) — —1, podemos reemplazar a P por 
Q — PE , donde 



Entonces Q es ortogonal, det(0) — 1 y 



Q‘AQ = E l P l APE = E f DE 



Operadores unitarios y ortogonales y sus matrices 439 


Por lo tanto, también podemos suponer que det(P) — 1. I>e acuerdo 
con el Ejercicio 20, tenemos que P (o P f ) representa geométricamente 
una rotación. 

En resumen, el término en xy de la ecuación (12) puede ser elimina- 
do mediante una rotación de los ejes x e y a los nuevos ejes jc' e y dada 
por X — PX ', donde P es una matriz ortogonal y det(P) = 1. Además, 
los coeficientes de ( x f ) 2 y (y') 2 son los eigenvalores de 



Este resultado es una nueva forma de enunciar el teorema de ejes 
principales para R 2 . Los argumentos anteriores, por supuesto, se extienden 
fácilmente a ecuaciones cuadráticas de n variables. Por ejemplo, para el 
caso en que n = 3, mediante una selección especial de los coeficientes 
obtenemos las superficies cuádricas —el cono elíptico, el elipsoide, el 
paraboloide hiperbólico, etc. 

Como ejemplo, considérese la ecuación cuadrática 2jc- — 4 xy + Sy 2 — 
— 36 = 0, para la cual la forma cuadrática asociada es 2x 2 — 4 xy -f- 5y 2 . 
Con la notación anterior 



de manera que los eigenvalores de A son 6 y 1 con eigenvectores asociados 

(-0 y (?)• 


Como es de esperarse (del Teorema 7.15), estos vectores son ortogonales. 
La correspondiente base ortonormal de eigenvectores es 


Por lo tanto, si 



1 \ 

/ 2 \ì 


VT 

vT 


-2 ’ 

l 


vt/ 

V7/J 

1 

2 \ 


VT 

VT 

1 

-2 

1 

“7T 

VT 

vr/ 



entonces P f AP — 


î> 


Bajo la 


1 , , 2 , 

x —- x + —y' 

V 5 V 5 


transformación X = PX', o bien 

y — —=zx’ + - y 

V 5 VT ’ 
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tenemos la nueva forma cuadrática 6(x') 2 -f (y') 2 . Así, la ecuación origi- 
nal 2x 2 — 4 xy + 5 y 2 — 36 — 0 puede escribirse en la forma óí* 7 ) 2 + 
+ (/) 2 = 36, en la que se puede ver fácilmente que se trata de la ecua- 
ción de una elipse. (Véase Fig. 7.4.) 



EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
los espacios con producto interior subyacentes son dimensionalmente fi- 
nitos. 

(a) Todo operador unitario es normal. 

(b) Todo operador ortogonal es diagonalizable. 

(c) Una matriz es unitaria si y sólo si es invertible. 

(d) Si dos matrices son unitariamente equivalentes también son seme- 
jantes. 

(e) La suma de dos matrices unitarias es unitaria. 

(f) E1 adjunto de un operador unitario es unitario. 

(g) Si T es un operador ortogonal en V, entonces [T]p es una matriz orto- 
gonal para cualquier base ordenada /3 para V. 
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(h) Si todos los eigenvalores de un operador son 1, entonces el operador 
debe ser unitario u ortogonal. 

(i) Un operador puede preservar la norma pero no el producto interior. 


Para cada una de las matrices siguientes A , encontrar una matriz ortogonal 
o unitaria P y una matriz diagonal D tal que P*AP = D. 


» -1\ (c) A _( 2 3 — 3/\ 

o) \3 + 3/ 5 ) 

(d) /0 2 2\ 

(e) /2 1 1\ 

A = 2 0 2 

A= 1 2 1 

\2 2 0/ 

\l 1 2/ 


Demostrar que el producto de operadores unitarios [ortogonales] es unita- 
rio [ortogonal]. 


Para z £C defínase a J z : C-+C mediante J z (u) = zu. Caracterizar aque- 
llas z para las cuales J z sea normal, autoadjunto o unitario. 


^Cuáles de los siguientes pares de matrices son unitariamente equivalentes? 
(a) /1 0\ /0 1\ (b) /0 1\ /0 i\ 

(o i) y (i o) (i o) y (i o) 

(c) / 0 1 0\ /2 0 0\ 

( -1 0 0) y ( 0 -1 0 ) 

\ 0 0 1 / \0 0 0 / 

(d) /01 0\ /1 0 0\ 

( -1 0 0 ) y (0 / 0 ) 

\ 0 0 1 / \0 0 -// 

Sea V el espacio con producto interior de las funciones continuas de valor 
complejo en [0, 1] con el producto interior 


(/, g) = 



f(t)g(t)dt. 


Sea h£V y defínase a T: V-> V mediante T(/) = hf. Demostrar que T es 
un operador unitario si y sólo si \h(t) = 1 para 0 < / < 1. 


Demostrar que si T es un operador unitario en un espacio con producto inte- 
rior, dimensionalmente finito, entonces T tiene una “raíz cuadrada”; esto es, 
existe un operador unitario U tal que T = U 2 . 


Sea V un espacio con producto interior, y sea T: V —> V un operador auto- 
adjunto. Si U = (T + /I) (T - /l)-\ demostrar, utilizando el Ejercicio 9 de 
la Sección 7.5, que U es unitario. 


Espacios con producio interior 


9. Sea U un operador lineal en un espacio con producto interior dimensional- 
mente finito V. Si 'U(jc) = \x\\ para toda en alguna base ortonormal 
para V, ^debe U ser unitaria? Demostrar o dar un contra ejemplo. 

10. Sea A una matriz compleja normal o real simétrica de n x n con eigenva- 
lores A„ . . . , a„ (no necesariamente distintos). Demostrar que 

tr(A ) = 2 A, y tr(A*A ) = 2 jA ; |-. 


11. Encontrar una matriz ortogonal cuyo primer renglón sea (i, i, J). 

12. Sea A una matriz real simétrica o normal compleja de n x n. Demostrar 
que 


det (A) = n X t , 

í= i 


donde los son los eigenvalores (no necesariamente distintos) de A. 


13. Supóngase que A y B son matrices diagonalizables. Demostrar, afirmativa 
o negativamente, que A es semejante a B si y sólo si A y B son unitaria- 
mente equivalentes. 

14. Sea U un operador unitario en un espacio con producto interior V, y sea 
W un subespacio U-invariante dimensionalmente finito de V. Demostrar que 

(a) U(W) = W. 

(b) \N L es U-invariante. 

Contrastar a (b) con el resultado del Ejercicio 15. 

15. Encontrar un ejemplo de un operador unitario U en un espacio con pro- 
ducto interior y un subespacio U-invariante W tal que \N L no sea U-inva- 
riante. 

16. Demostrar que una matriz que sea unitaria y triangular superior debe ser 
una matriz diagonal. 

17. Demostrar que “es unitariamente equivalente a’’ es una relación de equiva- 
lencia en M„„„(C). 

18. Sea W un subespacio dimensionalmente finito de un espacio con producto 
interior V. Por el Teorema 7.6, V = W© \N L . Defínase a U: V — V me- 
diante U(x, + x.) = jt, - x„ donde j:, ÇW y x. Ç Demostrar que U 
es un operador unitario autoadjunto. 
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19. Sea V un espacio con producto interior, dimensionalmente finito. Un opera- 

dor lineal U en V, se llama isometría parcial si existe un subespacio W de 

V tal que U(jc) | — ijjc'! para toda JtÇW y U(jc) — 0 para toda x£\N L . 

Obsérvese que W no necesariamente tiene que ser U-invariante. Supóngase 

que U es tal operador y que {jt,, ... , jc*} es una base ortonormal de W. 

Demostrar los incisos siguientes. 

(a) (U(jc), U(y)) = (jc, y) para toda jc, y£W. Sugerencia: Utilizar el 
Ejercicio 20 de la Sección 7.1. 

(b) {UíjcO, . . . , U(jca;)} es una base ortonormal para R(U). 

(c) Existe una base ortonormal y para V tal que las primeras k columnas 
de [U] y forman un conjunto ortonormal y las columnas restantes son 
nulas. 

(d) Sea {y,, . . . , y ỳ } una base ortonormal para R(U) 1 . Sea p — 
= {U(jc,), . . . , U(jca), y„ . .. , yj }. Entonces p es una base orto- 
normal para V. 

(e) Defínase a T como el operador lineal en V que satisface a T(U(a , í ) ) = 
= Jti(l < i < k) y a T(y t ) =0(1 </<;). Demostrar que T está 
bien definido y que T = U*. Sugerencia: Demostrar que (U(j:), >) = 
— (*, T (y)) para toda Jt, y€/?. Existen cuatro casos. 

(f) Demostrar que U* es una isometría parcial. 

Este ejercicio continúa en el Ejercicio 9 de la Sección 7.9. 


Una aplicación geométrica 

La finalidad del ejercicio siguiente es emplear el conocimiento hasta ahora 
obtenido en este capítulo para caracterizar los llamados “movimientos rígi- 
dos” en R 2 . Se puede pensar de una manera intuitiva en tal movimiento 
como una transformación que no afecta la forma de la figura bajo su 
acción; de ahí el nombre de “rígido”. Por ejemplo, las reflexiones, las rota- 
ciones y las translaciones (jc -> x -f jc 0 ) son ejemplos de movimientos rígi- 
dos. Veremos, de hecho, que todo movimiento rígido es una composición 
de estas tres transformaciones. La situación general en R n será tratada en la 
Sección 7.8 y utilizará los resultados de este ejercicio. 

20.* Sea V un espacio real con producto interior. Una función /: V —> V se llama 
movimiento rígido si 

!|/00 ” /(y)|| = \\x ~ y\\ para toda y£V. 

Para tal función /, defínase a T: V —> V mediante T(*) = f(x) — f(0). 

(a) Demostrar que T es lineal demostrando los cuatro incisos siguientes. 

( i ) ||T(jc)|| = ||jc|| para toda x£V. 

(ii) j|T(jc) - T(v)|| - W x ~ y|| P ara toda - V € v * 
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(iii) ("[(■*). T (}')) = (X, >-) para toda x, y£V. Sugerencia: Ex- 
pándanse ambos lados de (ii) utilizando las propiedades de 
los productos interiores y luego iguálense Ios resultados. 

(iv) ||T(x + ay) - T(x) - aT(y)|| = 0 para toda x, yÇV y a£R. 

(b) Utilizar (a) para deducir que todo movimiento rígido es un operador 
ortogonal seguido de una translación. 

(c) Demostrar que det(T) = ±1. 

(d) Sea V R 2 y sea /5 la base ordenada estándar para R 2 . Demostrar que 
existe un ángulo 0(0 < 6 < 2 v) tal que 

rn _/cos0 -seni9\ . , 

[T]p -(sen 6 cose) 81 det(T) = 1 

y 

rT , /cos 6 sen 6\ . , 

LT](3 = (sen0 -cos e) « det(T) = -1. 

Sugerencia: Utilizar el hecho de que las columnas de [T]^ forman 
un subconjunto ortonormal de R 2 . 

(e) Usar a (d) para deducir que todo movimiento rígido en R 2 es una 
rotación (con respecto al origen) seguida de una translación o una re- 
flexión (con respecto al eje x) seguida de una rotadón (con respecto 
al origen) seguida de una translación. Sugerencia: Obsérvese que 

/cos 6 — sen0\/l 0\ _ /cos 0 sen0\ 

\sen 0 cos # J \0 -l) ~ \^sen0 -cosflj’ 


21 . Sean y l9 ... , y n vectores linealmente independientes en F n y sean x l9 ... , 
x n vectores ortogonales obtenidos a partir de y l9 ... , y n mediante el proceso 
de ortogonalización de Gram-Schmidt. Sea Zi, . .. , la base ortonormal 
obtenida al definir 


(a) 


_ x k 

Zk INf 

Resolviendo la ecuacion (1) de la Sección 7.2 para y k en términos 
de Zk, demostrar que 


k -1 

yk = ||jfe||z* + 2 te, Zj)zj (l < k < n). 

} = l 

(b) Sean A y Q las matrices de n x n en las cuales las columnas k son 
y k y Zk, respectivamente. Defínase a R £M nxn (F) mediante 

í I \xj | J si j — k 

R ik = ( y k , Zj) si / < k 

[0 si / > k. 

Demostrar que A — QR. 
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(c) Calcular Q y R como en el inciso (b) para la matriz de 3 x 3 cuyas 
columnas son los vectores y u y 2 y y 3 , respectivamente, del Ejem- 
plo 12 de la Sección 7.2. 

(d) Como Q es unitaria [ortogonal] y R es triangular superior en el in- 
ciso (b), hemos demostrado que.toda matriz invertible es el producto 
de una matriz unitaria [ortogonal] y una matriz triangular superior. 
Supóngase que A €AA nxn (F) es invertible y A — QiRi = Q2R2 , donde 
Qu Ô 2 £ M nxn (F) son unitarias y R u R 2 € M nxn (F) son triangulares 
superiores. Demostrar que D = R^R] 1 es una matriz unitaria diago- 
nal. Sugerencia: Utilizar el Ejercicio 16. 

(e) La descomposición descrita en el inciso (b) proporciona un método 
de ortogonalización para resolver un sistema lineal AX—B donde 
A es invertible: Descomponer A en QR por el proceso de Gram- 
Schmidt (o por cualquier otro), donde Q sea unitaria y R sea trian- 
gular superior. Entonces QRX — B y por lo tanto RX = Q*B. Este 
último sistema puede resolverse fácilmente, puesto que R es triangu- 
lar superior. 

En un tiempo, a causa de su gran estabilidad, este método para 
resolver grandes sistemas de ecuaciones lineales por medio de una 
compuíadora se consideró como un método superior al de eliminación 
de Gauss, aun cuando requiere de tres veces más trabajo. (Posterior- 
mente, sin embargo, J. H. Wilkinson demostró que si el método de eli- 
minacion de Gauss se lleva a cabo adecuadamente, entonces es casi 
tan estable como el método de ortogonalizadón.) 

Emplear el método de ortogonalización y el inciso (c) para 
resolver el sistema 

Xi -j- 2x z + 2x 3 — 1 

<x x + 2x 3 = 11 

X 2 + X 3 — 

22 . Encontrar nuevas coordenadas x\ y' de manera que las siguientes formas 

cuàdráticas puedan escribirse como + X 2 (y') 2 . 

(a) x 2 + 4 xy + y 2 

(b) 2x 2 + 2^ + 2+* 

23 . Considérese la expresión X l AX, donde X % = (*, y, z) ý A es como se 
definió en el Ejercicio 2(e). Encontrar un cambio de coordenadas x', y', z! 
de manera que la expresión anterior pueda escribirse en la forma Ai(*') 2 + 
+ À 2 (y') 2 + X 3 (z') 2 . 

7 . 8 * LA GEOMETRIA DE LOS OPERADORES ORTOGONALES 

E1 Ejercicio 20 de la Sección 7.7 establece que cualquier movimiento rígido 
en un espacio real con producto interior es la composición de un operador 
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ortogonal seguido de una translación. Luego, para comprender detallada- 
mente la geometría de los movimientos rígidos, es necesario analizar la 
estructura de Jos operadores ortogonales. Tal es la finalidad de esta sec- 
ción. Como lo descubriremos, un operador ortogonal en un espacio real 
con producto interior dimensionalmente finito es el resultado de la com- 
posición de rotaciones y reflexiones. Principiaremos nuestra investigación 
con las definiciones de estos términos. 

Definiciones. Sea T uti operador lineal en un espacio real con producío inîerior 
dimensionalmente finito V. El operador T se llama rotación si T es la iden - 
tidad en V o si existe un subespacio bidimensional W de V, una base 
ortonormal /3 — {x^, x 2 } para W, y un número real 6 tal que 

T(x,) = x, cos 0 + x,> sen 0 , T(x,>) = — x x sen 0 + x, cos 0, 

y T(y) ~ y para toda y e W x . Dentro de este contexto T se denomina 
rotación de W alrededor de ^” 1 -. El subespacio yy 1 - se llama eje de ro- 
tación. 

En la Sección 2.1 se definieron las rotaciones para el caso especial 
donde V = R 2 . 

Definiciones. Sea T un operador lineal en un espacio real con producto interior 
dimensionalmente finito V. El operador T se llama reflexión si existe un 
subespacio unidimensional W de V tal que T(x) = -x para toda x Ç W 

y T fy) = y P ara toda y Ç W x . Dentro de este contexto T se llama re- 
flexión de V alrededor de W+ 


Debería hacerse notar que las rotaciones y las reflexiones (o aun las 
composiciones) son operadores ortogonales. (Ver el Ejercicio 2.) La fina- 
lidad principal de esta sección es establecer que la recíproca también es 
cierta, esto es, que cualquier operador ortogonal en un espacio real con 
producto interior dimensionalmente finito es el resultado de la composi- 
ción de rotaciones y reflexiones. 

Ejemplo 29. Caracterización de operadores ortogonales en un espacio 
real unidimensional con producto interior. 

Sea T un operador ortogonal en un espacio unidimensional con produc- 
to interior V. Tómese cualquier vector x no nulo en V. Entonces V = 
— L({x}) y así T(x) \x para alguna \Ç_R. Como T es ortogonal y À 
es un eigenvalor de T, A = ±1. Si X = 1, entonces T es la identidad en V 
y, P or lo tan I°» T es una rotación. Si À = — 1, entonces T(jc) = -jc para 
toda x Ç V y, por lo tanto, T es una reflexión de V alrededor de V x = {0}. 
Luego. T es una rotacion o una reflexion. Nótese que en eî primer caso 
det(T) — I y en el segundo caso det(T) = — 1. 
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Ejemplo 30. Algunas reflexiones típicas. 

(a) Sea T: R- —► R- definida mediante T(a, b) — (— a, b). Si W = 
= L({e,}), entonces T(x) = — x para toda jc£W y T(y) — y para toda 
y e W x . Luego, T es una reflexión de R- alrededor de W x — L({e>}), 
el eje y. 

(b) Sea T: R ? —»R : definida mediante T(a, b, c) - (a, b, —c). Si 
W = L({e, t}), entonce^s T(jc) = — jc para toda jcÇW y T(y) = y para toda 
y£ W x = L(\e u e 2 }), el plano xy. 

En el Ejemplo 29 caracterizamos a todos los operadores ortogonales 
en un espacio real unidimensional con producto interior. E1 teorema si- 
guiente caracteriza a todos los operadores ortogonales en un espacio real 
bidimensional con producto interior. La demostración de este resultado se 
obtiene fácilmente del Ejercicio 20 de la Sección 7.7, pues una reflexión 
alrededor del eje x seguida de una rotación por 0 es una reflexión alrede- 
dor de la recta que pasa por el origen con una pendiente de tan %Q. 

Teorema 7.22. Sea T un operador ortogonal en un espacio real bidimensional 
con producto interior V. Entonces, T es o una rotación o una reflexión. 
Además , T es una rotación si y sólo si det(J) = 1 y T es una reflexiân si 
y sólo si det(T) = — I. 

De acuerdo con la definición, cualquier reflexión en R- tiene los 
eigenvalores 1 y — 1, y cualquier par de eigenvectores correspondientes 
a estos eigenvalores son ortogonales. Además, el eigenespacio de T corres- 
pondiente a \ = 1 es unidimensional y, por lo tanto, puede ser descrito 



como una recta que pasa por el origen. Geométricamente, T refleja a todos 
los puntos de R- alrededor de esta recta. (Véase Fig. 7.5.) Por ejemplo, si 


1 

2 \ 

«n/T 

7T 1 

2 

-1 

vyy 

7T/ 


A = 
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es claro que L.i es un operador ortogonal en R 2 y que det(L A ) = det(4) = 
= — 1. Por lo tanto, L, 4 es una reflexión de acuerdo con el Teorema 7.22. 
Para encontrar el subespacio sobre el cual se refleja L, es suficiente en- 
contrar un eigenvector de l A correspondiente al eigenvalor A = 1. Uno de 
tales eigenvectores es , 

7T / 


En consecuencia, el subespacio sobre el cual i A se refleja es la recta 



1 , 

7T +1 

: t e R 

t 

2 


VT / J 


Corolario. Sea V un espacio real bidimensional con producto interior. La com- 
posición de una reflexión y una rotación en V es una reflexión en V. 

demostración. Si Ti es una reflexión en V y T 2 es una rotación en V, 
entonees, de acuerdo con el Teorema 7.22, det(T x ) = 1 y det(T 2 ) = — 1. 
Sea T = T 2 T x la composición. Como T 2 y T x son ortogonales, también T 
lo es. Además, det(T) = det(T 2 ) ■ det(Ti) = — 1. Luego, por el Teorema 
7.22, T es una reflexión. La demostración para T X T 2 es semejante. ■ 

Estudiaremos ahora operadores ortogonales en espacios de dimensión 
superior. 

Lema . Si T es un operador lineal en un espacio real con producto interior dimen- 
sionalmente finito y no nulo V, entonces existe un subespacio J-invariante 
W de V tal que 1 < dim( W) < 2. 

demostración. Fíjese una base ordenada /3 = {x u x 2 , ... , x n } para V, 
y sea A = [T]^. Sea <j>p: V R n la transformación lineal definida mediante 
<j>p(Xi) = ei para / = 1, 2, . . . , n. Entonces <j>$ es un isomorfismo, y he- 
mos visto en la Sección 2.4 que el diagrama de la figura 7.6 es conmutativo, 
esto es que L A <j>$ = <j>p T. En consecuencia, es suficiente demostrar que existe 
un subespacio Z de R n L A -invariante tal que 1 < dim(Z) < 2. Si enton- 
ces definimos a W = ^(Z), se tendrá que W satisface la conclusión del 
teorema. (Véase Ejercicio 12.) 

Puede considerarse a la matriz A como una matriz de n x n sobre C 
y como tal puede ser utilizada para definir un operador lineal U en C n 
mediante U(x) = Ax para todos los vectores columna x en C n . Como U 
es un operador en un espacio vectorial dimensionalmente finito sobre C, 
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^ V 
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L, 


R n 


figura 7.6 


tiene un eigenvalor A £ C. Sea x£C n un eigenvector correspondiente a X. 
Podemos escribir \ — Ai + i\ 2 , donde Ai y \ 2 son reales y 


j a t + ibA 

a 2 + ib 2 


\a„ + ibj 


donde las y las bi son reales. Luego, haciendo a 



j a l\ 


jbA 


a 2 \ 

1 i 

b 2 

Xl = 

. 

* 

II 

. 


' OrJ 

[ I 

\b n f 


tenemos que x = x x + ix 2 , donde Jti y x 2 son /t-dimensionales formadas 
por elementos reales. Nótese que al menos una de x x o x 2 es no nula ya 
que jc =4 0. Por lo tanto, 

U(x) — \x — (Ai + i\ 2 ) (^i + ix 2 ) 

— (A1JC1 — A 2 jc 2 ) + i(AiJC 2 + A 2 Xi). (14) 

De la misma manera 

U(jc) = A(x ± + ix 2 ) — Ax 1 + iAx 2 . (15) 


Comparando las partes real e imaginaria de las Ecuaciones (14) y (15), 
concluimos que 

Axí = A 1 JC 1 — \ 2 x 2 y Ax 2 = A^i + \ 2 x,. (16) 

Finalmente, sea Z — L((jti, jc 2 }) tomándolo como subespacio de R n . Como 
Xí += 0 o jc 2 +: 0, Z es no nulo. Luego, 1 < dim(Z) < 2 y por la Ecua- 
ción (16) Z es L r invariante. ■ 
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Teorema 7.23. Sea T un operador ortogonal en un espacio real no nulo con 
producto interior dimensionalmente finito V. Entonces, existe una colec- 
ción de subespacios T-invariantes ortogonales por parejas (W 3 , W,, ... , 
W IU } de V tales que 

(a) 1 < dim(\N x ) < 2 para i = 1, 2, . . . , m. 

(b) V = W> 0 W 2 0 • • • © W m . 

demostración. La demostración se hará jx>r inducción sobre dim(V). 
Si dim(V) = 1, el resultado es evidente. Por tanto, supóngase que el re- 
sultado es cierto para dim(V) < n para algún entero fijo n > 1. 

Supóngase que dim(V) = n. En virtud del lema existe un subespacio 
Wi de V T-invariante tal que 1 < dim(W!) < 2. Si W^ = V, el resultado 
queda establecido. De lo contrario, Wf ^ {0}. En virtud del Ejercicio 13 
Wf es T-invariante, y la restricción de T a Wf es ortogonal. Como 
dim(Wf) < n, podemos aplicar la hipótesis de inducción a T Wi l y con- 
cluir que existe una colección de subespacios T-invariantes ortogonales 
por parejas {W 2 , W,, . . . , W„,} de Wf tales que 1 < dim(W, ) < 2 para 

i = 2, 3, . .. , m y Wf = W 2 © W 3 ® • • • © W m . Por lo tanto, {W n , 

W 2 , . .. , W,„} es ortogonal por parejas y 

V = W, © Wf = W, 0 W 2 © • • • © W M . | 

Aplicando el Ejemplo 29 y el Teorema 7.22 en el contexto del Teo- 
rema 7.23, podemos concluir que la restricción de T a W, es una rotación 
o bien una reflexión para cada í = 1, 2, . .. , m. Así pues, en cierto sen- 
tido, T está formado de rotaciones y reflexiones. Desafortunadamente, 
puede decirse muy poco sobre la descomposición de V en el Teorema 7.23 
en términos de unicidad. Por ejemplo, las W ; , el número m de W ; y 
el número de W, para las que T Wi es una reflexión no son únicas. Aun 

cuando no es único el número de W f para los cuales T w , es una refle- 

xión, el que este número sea par o impar es una propiedad intrínseca de T. 
Además, siempre podemos descomponer a V de manera que T w . sea 
una reflexión para a lo más un Wi. Estos hechos se establecen en el 
resultado siguiente. 

Teorema 7.24. Sean T, V, W,, . . . , W„, como en el Teorema 7.23. 

(a) El que el número de i para las cuales T w . es una reflexión sea 
par o impar depende de que det{ T) = 1 o det( T) = - 1. 

(b) Siempre es posible descomponer a V como en el Teorema 7.23 
de manera que el número de i para las que T w , es una refle- 
xìón sea cero o uno, dependiendo de que det(J) = 1 o det(J) — 
— ~ 1. Además, si T w . es una reflexión, entonces dim(\N,) = I. 
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DEMOSTRACIÓN. 

(a) Sea r el número de W* en la descomposición para las cuales 
T wi es una reflexión. Por lo tanto, de acuerdo con el Ejercicio 14, 

det(T) - det(T Wl ).det(T Wl ).det(T w J = (-1)% 

con lo que se demuestra el inciso (a). 

(b) Sea E = {jcÇV: T(x) = — x}; entonces E es un subespacio T- 
invariante de V. Si W = E 1 , entonces W es T-invariante. Así, aplicando 
e! Teorema 7.23 a T w obtenemos una colección de subespacios T-inva- 
riantes ortogonales por parejas {W 1? W 2 , . . . , \N k ) de W tales que 
1 < dim(Wj) < 2 para 1 < i < k y W = W, ® W 2 © • • - 0 W*. Ob- 
sérvese que, para cada i — 1,2,...,/:, T Wí es una rotación. De lo con- 
trario, si T Wi es una reflexión, existe un elemento x£W, no nulo, para el 
cual T(jc) — —x. Pero entonces x e W,- n E ç E 1 n E = {0}, lo cual es 
una contradicción. Si E — {0}, se obtiene el resultado. De lo contrario, 
tómese una base ortonormal 8 para E que contenga p elementos (p > 0). 
Es posible descomponer a /3 en una unión disjunta por parejas — p x U 
U ,/T U ... U p r tal que cada contenga exactamente dos elementos 
para i < r y que 8, contega dos elementos cuando p sea par y un ele- 
mento si p es impar. Para cada / = 1, 2, . . . , r, sea W* +1 = L (/?,). Enton- 
ces, claramente {W l5 W 2 , . . . , W ky . . . , W* + ,.} es ortogonal por parejas y 

v = W, © W 2 0 • • • © W* © •.. © W* +r . (17) 

Además, si cualquier /3, contiene dos elementos, entonces 

det(T w ,.,) = det([T w ,„]^) = det ^ ^ J 

Entonces T Wfc+i es una rotaoión y, por lo tanto, T w . es una rotación para 
/ < k 4- r. Si p r está formado por un elemento, entonces dim(W** r ) — 1 
y det(T Wt+r ) = det([T Wt+r ]„ r ) = det(— 1) = —1. Así pues, T Wfr+r es una re- 
flexión, por el Teorema 7.23, y concluimos que la descomposición de la 
Ecuación (17) satisface la condición del inciso (b). ■ 



Como consecuencia del teorema anterior, un operador ortogonal se 
puede descomponer como un producto de rotaciones y reflexiones. 


Corolario. Sea T un operador ortogonal en un espacio real con producto interior 
dimensionalmente finito V. Entonces existe una colección {T, T 2 , . . . , T m } 
de operadores ortogonales en V tales que 


(a) Para cada i, T es una reflexión o bien una rotación. 

(b) Para una i como máximo, T es una reflexión. 

(c) TjTj = TjTj para toda i y toda j. 

(d) T = T,T 2 . . . T m . 


(e) 


det( T) - 


i 

t. 


1 si Tj es una rotación para cada i 
— 1 en cualquier otro caso 
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demostración . Como en la demostración del inciso (b) del Teorema 
7.24 podemos escribir V = Wj @ W 2 0 * • ■ © W m , donde T Wi es ima 
rotación para / < m. Para cada / = 1, 2, . .. , m, defínase a T 4 : V-> V 
mediante 

T i(Xi +•••+**) = *!+•(?•+ x f _, + T(Xf) + x, + 1 + • • - + jc m , 

donde x, £W ) para toda /. Puede demostrarse fácilmente que cada L es 
un operador ortogonal en V. De hecho, T* es una rotación o una reflexión 
dependiendo de que T Wí sea una rotación o ima reflexión. Esto demuestra 
los incisos (a) y (b). Las demostraciones de (c), (d) y (e) se dejan 
como ejercicio. (Véase Ejercicio 15.) 

Ejemplo 31. Operadores ortogonales en un espacio real tridimensional 
con producto interior. 

Sea T un operador ortogonal en un espacio real tridimensional con pro- 
ducto interior V. Demostraremos que T puede descomponerse en una 
rotación y a lo más una reflexión. Sea V = Wj @ W 2 © • • • © W m una 
descomposición como la del Teorema 7.24(b). Claramente m = 2 o 
m = 3. 

Si m = 2, entonces V = (J) W 2 . Sin pérdida de generalidad, supón- 

gase que dim(Wi) = 1 y dim(W 2 ) = 2. Luego, T Wi es una reflexión, o 
bien la identidad en W a , y T Wa es una rotación. Definiendo L y T 2 como 
en la demostración del corolario del Teorema 7.24, tenemos que T = TiT 2 
es Ia composición de una rotación y a lo más una reflexión. (Nótese que 
si T Wi no es una reflexión, entonces T x es la identidad en V y T = T 2 .) 

Si m = 3, entonces V = W t ® W 2 ®W 3 y dim(W*) = 1 para toda /. 
Para cada /, sea T * como en la demostración del corolario del Teorema 
7.24. Si T Wi no es una reflexión, entonces T* es la identidad en W ÌB De lo 
contrario L es una reflexión. Como T Wi es una reflexión para una / como 
máximo, concluimos que T es una reflexión fcencilla o bien la identidad 
(una rotación). 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase para 
lo que sigue que los espacios vectoriales subyacentes son espacios reales 
con producto interior dimensionalmente finitos. 

(a) Cualquier operador ortogonal es una rotación o una reflexión. 

(b) La composición de dos rotaciones cualesquiera en un espacio bidi- 
mensional es una rotación. 

(c) La composición de dos rotaciones cualesquiera en un espacio de tres 
dimensiones es una rotación. 
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(d) La composición de dos rotaciones cualesquiera en un espacio de 
cuatro dimensiones es una rotación. 

(e) E1 operador identidad es una rotación. 

(f) La composición de dos reflexiones es una reflexión. 

(g) Cualquier operador ortogonal es unr. composición de rotaciones. 

(h) Para cualquier operador ortogonal T, si det(T) = —1, entonces T es 
una reflexión. 

(i) Las reflexiones siempre tienen eigenvalores. 

(j) Las rotaciones siempre tienen eigenvalores. 

2. Demostrar que las rotaciones, las reflexiones y las composiciones de rota- 
ciones y reflexiones son operadores ortogonales. 


3. Sea 


I 4 



VTV 

2 

1 

27 




)• 


(a) Demostrar que l A : R 2 R 2 es una reflexión. 

(b) Encontrar el eje en R 2 alrededor del cual se refleja L A , esto es, el 
subespacio de R 2 en el cual l A actúa como la identidad. 

(c) Demostrar que l AB y l fíA son rotaciones. 


4. Para cualquier número real </>, sea 

^ — (cos </> sen </> \ 

\ sen </> — cos </> J 

(a) Demostrar que l A es una reflexión. 

(b) Encontrar el eje en R 2 alrededor del cual L A se refleja. 


5. Para cualquier número real </>, definir a T^ = l A , donde 

cos </> — sen </> 
sen </> cos </> 

(a) Demostrar que cualquier rotación de R 2 es de la forma T^> para algu- 
na </>. 

(b) Demostrar que T^ = T ( ^ } para cualquier </>, 

(c) Deducir que cualquier par de rotaciones en R 2 conmutan. 

6. Demostrar que la composición de cualquier par de rotaciones en R 3 es una 
rotación en R 3 . 



7. Dados los números reales </> y ý, defínanse matrices 

( 10 0 \ /cosip — sen ^ 0\ 

0 cos <f> — sen </> I y B = ( sen ý cos ỳ 0 j. 

0 sen </> cos </>/ V 0 0 \J 
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(a) Demostrar que l A y L* son rotaciones. 

(b) Demostrar que L.i/, es una rotación. 

(c) Encontrar el eje de rotación para l Alf . 

8 . Demostrar que ningún operador ortogonal puede ser a la vez una rotación 
y una reflexión. 

9. Demostrar que si V es un espacio real de dos o tres dimensiones con pro- 
ducto mterior, entonces la composición de dos reflexiones en V es una 
rotación en V. 

10. Dar un ejemplo de un operador ortogonal que no sea ni reflexión ni ro- 
tacion. 

11. Sea V un espacio real con producto interior dimensionalmente finito. Defí- 
nase a T: V-*V mediante T(at) = -j:. Demostrar que T es un producto 
de rotaciones si y sólo si dim(V) es par. 

12. Completar la demostración del lema del Teorema 7.23, demostrando que 
W — 4‘p (Z) satisface las condiciones requeridas. 

13. Sea T un operador ortogonal [unitario] en un espacio real [complejo] di- 
mensionalmente finito con producto interior V. Si W es un subespacio 
T-invariante de V, demostrar que 

(a) T w es un operador ortogonal funitario] en W. 

(b) W x es un subespacio T-invariante de V. 

Sugerencia: Utilizar el hecho de que T w es uno-a-uno y sobreyectivo 
para llegar a la conclusión de que, para ôualquier víW T*(v) — 
= T-(y)eW. 

(c) T W o. es un operador ortogonal [unitario] en W. 

14. Sea T un operador hneal en un espacio vectorial dimensionalmente finito V. 
Supóngase que V es una suma directa de subespacios T-invariantes V - 

Wj © W 2 ® • • • © W*. Demostrar que det(T) = det(T Wl ).det(T Wf ). 

det(T Wt ). 

15. Completar la demostración del corolario del Teorema 7.24. 

16. Sea T un operador ortogonal en un espacio real n-dimensional con produc- 
to mterior V. Supóngase que T no es la identidad. Demostrar que 

(a) Si n es impar, T puede expresarse como la composición de a lo más 
una reflexión y a lo más ì(n ~ 1) rotaciones. 

(b) Si n es par, entonces T puede expresarse como la composición de a 
lo más in rotaciones o como la composición de una reflexión y a lo 
más ì(n — 2) rotaciones. 
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17. Sea V un espacio real con producto interior de dimensión 2. Para cuales- 
quier x, yÇV tales que x =£ y y = ||y(| — 1, demostrar que existe una 
rotación única T en V, tal que T (jc) = y. 

7.9 PROYECCIONE5 ORTOGONALES 
Y EL TEOREMA ESPECTRAL 

En e-sta sección nos basaremos en gran parte en el Teorema 7.17 para des- 
arrollar una elegante representación de un operador normal T en un espacio 
complejo dimensionalmente finito con producto interior. Demostraremos 
que tal operador puede escribirse en la forma -F . . . 4 - A*T*, donde 
Aj, ... , Xj- son los distintos eigenvalores de T y Tj, . . . , T* son “proyec- 
ciones ortogonales”. Pero primero debemos desarrollar algunos resultados 
sobre estas proyecciones especiales. 

E1 lector recordará de la Sección 2.1 que una transformación lineal 
T: VV es una proyección (en su rango R(T)) si V = R(T) ® N(T). 
De hecho, T es una proyección si y sólo si T = T- (véase Ejercicio 14 de 
la Sección 2.3). 

Definición. Sea V un espacio con producío inierior , y sea T: V —» V una pro - 
yección. Decimos que T es una proyección ortogonal si R(T ) 1 — N(T) y 
NOT- = R(T). 

Nótese que, por el Ejercicio 12(c) de la Sección 7.2, si V es dimensio- 
nalmente finito, sólo tenemos que suponer que una de las condiciones 
anteriores se cumple. Por ejemplo, si R(T) 1 - = N(T), entonces R(T) = 
R(T ) 11 = N(T) 1 . 

Ahora supongamos que W es un subespacio dimensionalmente finito 
de un espacio con producto interior V. E1 Teorema 7.6 garantiza que existe 
una proyección ortogonal en W. Podemos decir aún más —existe exacta- 
mente una proyeceión ortogonal en W. Ya que si T y U son proyecciones 
ortogonales en W, entonces R(T) = W=R(U); por lo tanto N(T) = 
R(T ) 1 = R(U ) 1 = N(U), y como todas las proyecciones están deter- 
minadas de manera única por su rango y por su espacio nulo (kernel), 
tenemos que T = U. Llamamos a T la proyección orîogonal sobre W. 
Para comprender la diferencia geométrica entre una proyección arbitraria 
sobre W y la proyección ortogonal sobre W, sean V = R'- y W = L{ (1, 
1)}. Defínanse U y T como en la Figura 7.7, donde T(v) es el pie de 
una perpendicular que parte de v e intersecta a la recta y = x, y U(a,, a>) — 
— (a u a { ). Entonces T es ia proyección ortogonal sobre W, y U es una 
proyección sobre W que no es ortogonal. Nótese que v — T(v) e ^ 1 , 
mientras que v — U(v) ^ W x . 
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De la Figura 7.7 vemos que T(v) es la “mejor aproximaeión en W 
para v”; esto es, si >vÇW, ||w — v|| > ||T(v) — v||. Esta propiedad de 
aproximación caracteriza a T. De hecho, muchos autores definen las pro- 
yecciones ortogonales en términos de esta propiedad. 

Teorema 7.25. Sea W un subespacio dimensionalmente finito de un espacio con 
producto interior V, y sea T la proyección ortogonal sobre W. Entonces, 
para cualquier v£W: el vector T(v) es el único elemento de W que se 
acerca más a v; esto es, ||v — T(v)|| < ||v — w|| para toda w(W. 

demostración. Sea vÇV. Como T es una proyecdón ortogonal, pode- 
mos escribir v = T(v) + (v — T(v)), donde v — T(v) £N(T) — \N L . Sea 
vvÇW. En virtud del Ejercicio 10 de la Secdón 7.1, tenemos que 

||v - w|| 2 = ||T(v) - w + (v - T(v))|| 2 

= ||T(v) - w|| 2 + ||v - T(v)|| 2 > ||v - T(v)|| 2 , 

demostrando así la desigualdad anterior. Si para alguna w £ W tenemos que 
11 v — w\\ — 11 v — T( v ) 11 , vemos del cálculo anterior que ||T(v) — w|| 2 = 
= 0; esto es, vv = T(v). ■ 

En la Sección 7.10 veremos una aplicación muy importante del Teore- 
ma 7.25 al tema de la aproximación por mínimos cuadrados que aparece 
frecuentemente en estadística. 

Por ahora, aplicaremos el Teorema 7.25 para obtener un resultado 
muy conocido en el Análisis de Fourier. Recuérdese el espacio con pro- 
ducto interior H de las funciones continuas en el intervalo [0, 2 tt] intro- 
ducido en la Sección 7.1. Defínase a un polinomio trigonométrico de grado 
n como una función g £ H de la forma 

£(*) = 2 aje iix 9 

j = -n 

donde a n o a_ n son diferentes de cero. 
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Sea / £H. Demostraremos que la mejor aproximación de f por un poli- 
nomio trigonométrico de grado menor o igual a n es el polinomio cuyos 
coeficientes son los coeficientes de Fourier de f con respecto al conjunto 
ortonormal { e' ,J : j es un entero}. 

Para este resultado, sea W = L({e' jx : |/| < n) ) y sea T la proyeceión 
ortogonal sobre W. E1 Teorema 7.25 nos dice que 


T (/) 


2 (/, e iix )e iix 


es la mejor representación de / en H. (Véase también el Corolario 1 del 
Teorema 7.6.) 

Una caracterización algebraica de proyeeciones ortogonales se tiene 
en el teorema siguiente. 


Teorema 7.26. Sea V un espacio con producîo interior, y sea T un operador li- 
neal en V. Entonces T es una proyección ortogonal si y sôlo si V = T = T*. 

demostración. Supóngase que T es una proyección ortogonal. Como 
T = T 2 por el hecho de ser T una proyección, sólo necesitamos demostrar 
que T = T*. Ahora bien, V = R(T) © N(T) y R(T) X = N(T). Si x, y€V, 
entonces x = + x 2 e y = yi + y 2 , donde x u yi €R(T) y x 2 , y 2 €N(T) 

Por lo tanto 

(x, T(y)) = (*! + x 2 , yO = (*!, yi) 1+ (* 2 , yO = (*i, 7i) 


y 

(x, T*(y)) = (T(x), y) = (x„ yi + y 2 ) = (x lt y x ) + (*„ y 2 ) = (+, 7i)- 

Así, (x, T(y)) = ( x, T*(y)) para todo x, y €V y, por lo tanto, T = T*. 

Ahora supóngase que T = T 2 = T*. Entonces, por el Ejercicio 14 de 
la Sección 2.3, T es una proyección y, por lo tanto, debemos demostrar que 
R(T) = N(T) X y R(T) X = N(T). Sean x€R(T) y y €N(T). Entonces * = 
= T(x) = T*(x), y así ( x, y) = (T*(x), y) = (x, T(y)) = (x, 0) = 0. 
Por lo tanto jc e N(T) J , de donde se tiene que R(T) £ N(T) X . 

Sea ye N(T) X . Debemos demostrar que y €R(T), esto es, que T(y) = 
= y. Ahora bien, 

||y — T(y)|| 2 = (y-T(y).y-T(y)) 

= (y, y - T(y)) - (T(y), y - T(y)). 

Como y - T(y) €N(T), el primer término es cero. Pero también (T(y), 
y - T(y)) = (y, T*(y - T(y))) = (y, T(y - T(y))) = (y, 0) = 0. 
Así, tenemos que y — T(y) = 0; esto es, y = T(y) €R(T). Por lo tanto 
R(T) = N(T) X . 

Utilizando lo anterior, tenemos que R(T) X = NOO 1 - 1 - 2 N(T) (en vir- 
tud del Ejercicio 12(b) de la Sección 7.2). Unicamente necesitamos de- 
mostrar que si x s R(T) X , entonces x € N (T). Para cualquier y€V, tene- 



458 Espacios con producto interior 


mos que (TO), y) — (x, T*(y)) = (x, T(y)) = 0. Así, T (jc) = 0 y por 
tanto x Ç N(T). ■ 

Sea V un espacio dimensionalmente finito con producto interior, W un 
subespacio de V y T la proyección ortogonal en W. Podemos escoger una 
base ortonormal /3 = {x^, . . . , x n ) para V tal que { x u ... , x /v } sea 
una base para W. Entonces [T]^ es una matriz diagonal con unos a lo 
largo de los primeros k elementos de la diagonal y ceros en cualquier 
otra posición. De hecho, [T]^ tiene la forma 



donde O u O, y O * son matrioes nulas. 

Si U es una proyección cualquiera sobre W, podemos escoger una base 
y para V tal que [U] r tenga la forma anterior; sin embargo, no es necesario 
que y sea ortonormal. 

Teorema 7.27. (El teorema espectral.) Supóngase que T es un operador lineal 
en un espacio con producto interior dimensionalmente finito V sobre F. 
Supóngase que T es normal si F — C y que T es autoadjunta si F = R. 
Si Xj, . . . , À k son los distintos eigenvalores de T, sea Wj = Ex. ~ {x£V: 
T(x) = XjX) el eigenespacio de T correspondiente al eigenvalor Ài (1 < 
< i < k) y sea T, la proyección ortogonal sobre Wi(l < i < k). Enton- 
ces 

(a) V = W,® ... ©W k . 

(b) Si W' es la suma directa de los subespacios W J? i, entonces 

\Nt ~ w;. 

(c) TJj = SjjTj para 1 < i, j < k. 

(d) 1 = 1,+ ...+ T k . 

(e) T = AJ, + . . . + ÀiJfc. 

DEMOSTRACIÓN. 

(a) De acuerdo con el Teorema 7.17, T es diagonalizable y enton- 
ces, de acuerdo con el Teorema 5.14, V = W^ © ... © W A . 

(b) Si xÇW; y yÇW,- para algunas i y /, entonces (x, y) = 0, de 
acuerdo con el Teorema 7.15. Se infiere de esto fácilmente que £ W/-. 
Ahora bien, de (a) tenemos que 

dim(W') — 2 dim(W ) = dim(V) — dim(W.). 

) 

Por otra parte, de acuerdo con el Corolario 2 del Teorema 7.6, tenemos 
que dim(W/-) = dim(V) — dim(W,). Por lo tanto, W,- = W, L , con lo que 
se demuestra el inciso (b). 

La demostración del inciso (c) se deja como ejercicio. 
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Como Tj es la proyección ortogonal sobre Wj, tenemos de (b) que 
N(T,) = R(T t) 1 = W/- = Wí. Por lo tanto, para x£V tenemos que x = 
= JCi -f ... 4- x k , donde Xj £W } y T, (jc) = x-, 9 demostrando el inciso (d). 

(e) Para x£V, escríbase x = x t + ... + x k , donde x } ÇW ; (1 < 
</</:). Entonces T (jc) = T (jc, ) + . . . + T(*a) ~ À,*! + . . . + 
+ \ k x k = XiT-lÌx) + . . . + \fil k (x) = (A,T, + . . . + À/Ja)(+). ■ 


E1 conjunto {Ài, . . . , À*} de eigenvalores de T se llama espectro de T, 
la suma I = T a + ... + T* del inciso (d) se llama resolución del operador 
identidad inducida por T, y la suma T = Àj, + . . . + ÀJa del inciso (e) 
se denomina descomposición espectral de T. Como los distintos eigenvalo- 
res de T quedan determinados de manera única (hasta el orden) por los 
subespacios Wj (y, por lo tanto, por las proyecciones ortogonales TJ, la 
descomposición espectral de T es única. 

Con la notación anterior, sea /3 la unión de las bases ortonormales de 

los W i y sea m x = dim(W,). (Luego, m, es la multiplicidad de À,.) 

Entonces, [T]p tiene la forma jXj mi O • O \ 

O X 2 I mí • • • O 


\ O 


o 


XJJ 


esto es, [T]^ es una matriz diagonal en donde los elementos de la diagonal 
son los eigenvalores Àj de T, y cada À, se repite m x veces. Si T = À J, + 
+ . . . + àJa como en el inciso (e) del teorema espectral, entonces se 
tiene (del Ejercicio 7) que g(T) = gíÀjT, + . . . + g(À,v)T fc para cual- 
quier polinomio g. Más adelante utilizaremos este hecho. 

Enunciaremos ahora algunos corolarios interesantes del teorema espec- 
tral; muchos resultados más se encuentran en los ejercicios. Para lo que 
sigue supondremos que V es un espacio con producto interior dimensional- 
mente finito sobre F y que T es un operador lineal en V. 


Corolario 1. 5/ F = C, entonces T es normal si y sólo si T* = g(T) para algún 

polinomio g. 

demostración. Supóngase primero que T es normal. Sea T = Àj, + . . . 

. . . + À.,J u la descomposición espectral de T. Tomando el adjunto de ambos 
lados de la ecuación anterior tenemos T* = À,T, + . . . + \J l: ya que cada 
uno de los T, son autoadjuntos. Empleando la fórmula de interpolación 
de Lagrange (ver p. 49), podemos escoger un polinomio g tal que g(\,) — 
= à; para 1 </</:. Entonces 

g(T) = g(À,)T, + . . . + g(À/JT/, 

= Àj, + ... + À;J /, 

= T*. 
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Recíprocamente, si T* — g(T) para algún polinomio g, entonces T 
conmuta con T*, puesto que T conmuta con todo polinomio en T. | 

Corolario 2. Si F = C, entonces T es unitario si y sólo si T es normal y |A.| = 1 
para todo eigenvalor X de T. 

demostración. Supóngase primero que T es unitario y, por lo tanto, 
normal. Entonces si T(x) = Ax, tenemos que \x\- 1|*|| = J|ajc|| = ||T(x)| 
|| = ||*|| y, por lo tanto, |A| = 1 si x^O. 

Ahora supóngase que J\| = 1 para todo eigenvalor À de T, y sea 
T = AJx + ... + x k J k la descomposición espectral de T. Entonces, por 
el inciso (c) del Teorema 7.27, 

TT* (AiTi + . . . + À*Tj;) (ÀjTì + . . . + ÀjfcT*) 

= jAxirr» + ... + |a*| 2 t* 

= T x + ... + T* 

= I. 

Por lo tanto, T es unitario. | 

Corolario 3. Si F = C y T es normal, entonces T es autoadjunto si >' sólo si 
todo eigenvalor de T es real. 

demostración. Sea T = À, Tj + . .. + A,T, la descomposición espectral 
de T. Supóngase que todo eigenvalor de T es real. Entonces T* = AJ^ + 
+ . . . + À*T* = AJ^ + . . . + A*T* = T. 

La recíproca ya ha sido demostrada en el Corolario 2 del Teorema 
7.15. ■ 

Corolario 4. Sea T como en el teorema espectral con una descomposición es- 
pectral T — Ajj + . . . i+ AJ k . Entonces, cada T x es un polinomio en T. 

demostración. Selecciónese un polinomio gjl <j < k) tal que gjAj = 
= Sij. Entonces, gJT) = gjAjT, + . . . + gj (x k )T k = + . .. + 

+ SfcJ* = Tj. ■ 


EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. Supóngase que 
los espacios subyacentes con producto interior son dimensionalmente finitos. 

(a) Todas las proyecciones son autoadjuntas. 

(b) Las proyecciones ortogonales están determinadas de manera única 
por su rango. 

(c) Todo operador autoadjunto es una combinación lineal de proyecciones 
ortogonales. 
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(d) Si un operador posee una descomposición espectral, también la posee 
su adjunto. 

(e) Si T es una proyección en W, entonces T(jc) es el vector de W más 
cercano a x. 

(f) Toda proyección ortogonal es un operador unitario. 

2. Sean V=R 2 , W = L(((1, 2)}) y p Ia base ordenada estándar para V. 
Calcular [T]p, donde T es la proyección ortogonal sobre W. Realizar lo 
mismo para V = R 3 y W = L({(1, 0, 1)}). 

3. Para cada una de las matrices A del Ejercicio 2 de la Sección 7.7 

(i) Demostrar que l A posee una descomposición espectral. 

(ii) De una manera explícita, defínanse cada una de las proyecciones 
ortogonales en los eigenespacios de l A . 

(iii) Verifíquense los resultados utilizando el teorema espectral. 

4. Sea W xm subespacio dimensionalmente finito de un espacio con producto 
interior V. Demostrar que si T es la proyección ortogonal sobre W, entonces 
I — T es la proyección ortogonal sobre W x . 

5. Sea V un espacio dimensionalmente finito con producto interior, y sea T: 
V —» V una proyección. 

(a) Si T es una proyección ortogonal, demostrar que ||T(x)|| < \\x\\ para 
toda xÇV. Dar un ejemplo de una proyección T para la cual no se 
cumpla esta desigualdad. Si se da la igualdad, ^qué puede concluirse 
sobre T? 

(b) Si T es también normal y V es compleja, demostrar que T debe ser 
una proyección ortogonal. 

6. Si T y U son proyecciones ortogonales en un espacio con producto interior 
tales que TU = T 0 = UT, demostrar que R(T) = R(U) X . 

7. Sea T un operador normal en un espacio complejo con producto interior 
dimensionalmente finito V. Utilizar la descomposición espectral AiU + . . . 

. . . í+ a*T* de T para demostrar los siguientes incisos. 

(a) Si g es un polinomio, entonces 

*(T) =ìg(K)Ti. 

i 3 1 

(b) Si T n — T 0 para alguna n, enîonces T = T 0 . 

(c) U: V-> V conmuta con T si y sólo si U conmuta con cada T im 

(d) Si U: V —> V es normal y conmuta con T, entonces U = + . . . 

. . . + ju r T r , donde fi u ... , son los eigenvalores (no necesariamen- 
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te distintos) de U. Sugerencia: Demostrar que los eigenespacios de 
T son invariantes bajo U. 

(e) Existe un operador normal U en V tal que U- = T. 

(f) T es invertible si X; 0 para 1 < i < k. 

(g) T es una proyección si y sólo si todo eigenvalor de T es 1 o 0. 

(h) T — — T* (tal T se denomina antisiméîrico) si y sólo si todo À* es 

un número imaginario. 

8 . Utilizar el Corolario 1 del teorema espectral para demostrar que si T es 
un operador normal en un espacio complejo dimensionalmente finito con 
producto interior y U conmuta con T, entonces U conmuta con T*. 

9. Refiriéndose al Ejercicio 19 de la Sección 7.7, demostrar los siguientes 
hechos sobre U. 

(a) U*U es una proyección ortogonal sobre W. 

(b) UU*U = U. 

10. Diagonalización simultánea. Sea V un espacio complejo dimensionalmente 
finito con producto interior, y sean U, T: V —> V operadores normales tales 
que TU = UT. Demostrar que existe una base ortonormal para V formada 
por vectores que son eigenvectores tanto de T como de U. Sugerencia: 
Emplear la sugerencia del Ejercicio 13 de la Sección 7.5 junto con el 
Ejercicio 8. 

11. Demostrar el inciso (c) del teorema espectral. 


7.70* APROXIMACION POR MINIMOS CUADRADOS 

Considérese el siguiente problema: Un investigador recolecta información 
mediante la realización de mediciones y u y 2 , ... , y m en los instantes t u 
’ ím ’ re spcctivamente. Por ejemplo, puede realizar mediciones sobre 
el desempleo en distintas fechas durante un período. Supóngase que grafica 
los datos (/j, yO, . . . , ( t m , y m ) como puntos del plano. (Véase Fig. 7.8.) 
A causa de la distribución de tales puntos, él piensa que existe una 
correlación lineal entre y y t, tal como y = ct -f d. E1 investigador desearía 
encontrar el valor de los parámetros c y d de tal manera que la recta 
y - ct + d represente el mejor “ajuste” posible para los datos recopilados. 
Una estimación del ajuste es calcular el error E que representa la suma 
de los cuadrados de las distancias verticales de los puntos a la recta; esto 
es, 


m 

E = 2 (>’, - ct, - d) -. 

i 1 
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figura 7.8 

Así, su problema es encontrar las constantes c y d que minimicen a E. 
(Para esta razón, la recta y = ct + d se denomina la recta de los mínimos 
cuadrados.) Esto lo conduce a considerar el siguiente sistema de ecua- 
ciones: 

t\C + d = y\ 
t 2 c + d — y 2 

't m c + d y mf 

o bien AX = y, donde 



r 


iy i\ 


h i 


y 2 

A = 


• * = U y y= 



1 t m J 


W 


Nótese que E — \\y — AX\ 

Por supuesto, sería irreal suponer que tal sistema tiene una solución 
puesto que, en la práctica, el número de ecuaciones excede con mucho al 
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número de incógnitas. Pero desarrollaremos ahora un método general 
utilizando la teoría de las proyecciones ortogonales para encontrar un 
vector explíoito jc 0 £ F n que minimioe a E\ esto es, dada una matriz A 
de rrt x n, encontraremos a jc 0 ÇF n tal que ||y — Ax 0 1| < ||y - Ax\\ P a ra 
todos los vectores x£F n . Este método no sólo nos permitirá encontrar la 
función lineal que se ajuste mejor a los datos, sino también el polinomio 
de cualquier grado fijo que se ajuste mejor a los datos. 

Requeriremos primero de algo de notación y de dos lemas sencillos. 

Para x, yÇ F n , denotaremos por ( x , y) n al producto interior ordinario 
de x y y en F n . 

Lema 1 . Sean A una matriz de m x n sobre F, x £ F n y y £ F m . Entonees 

(Ax, y). m = (x, A*y) n . 

demostración. Demostraremos el resultado para x y y contenidas en 
las bases ordenadas estándar, respectivamente, para F n y F” 1 . Dejamos el 
caso general para el lector. Sean x = e^ y y = e'. dichos elementos. Utili- 
zando el Teorema 2.15, tenemos 

(Ae h e'j) m = (A\ e') m = A Jt Y (e h A*e'j) n = (e h (A*)>) n = (Â% = A Jh 
donde A * y ( A*) j son las columnas i de A y / de A*, respectivamente. ■ 

Lema 2. Sea A una matriz de m x n sobre F. Entonees rango(A*A) = ran- 
go( A). 

demostración. Sólo tenemos que demostrar que, para x £ F n , A*Ax = 0 
si y sólo si Ax = 0. Claramente Ax = 0 implica que A*Ax = 0. Por ello, 
supóngase que A*Ax = 0. Entonces 0 = (A*Ax, x) n = (Ax, A**x) m = 
= (/lx, /4x) w , de modo que Ax = 0. ■ 

Corofario. Si A es una matriz de m x n tal que rango(A) — n (esto es, A 
tiene if rango completo”), entonces A*A es invertible. 

Ahora considérese el sistema AX = y, donde A es una matriz de 
m x n y y £ F m . Defínase a W = {Ax: xÇF n }, esto es, W = R(L). Ha- 
ciendo a T la proyección ortogonal sobre W, escójase a x 0 £ F n tal que 
T(y) = Ax 0 . Entonces, por el Teorema 7.25, ||T(y) — y|| < ||w — y|| 
para toda m£W; esto es, || Ax 0 — y || < || Ax — y\\ para toda xÇF n . 

Para desarrollar un método práctico para encontrar tal jc 0 , observamos 
que, como T es una proyección ortogonal, Ax 0 — y ~ T(y) — y £W t y 
entonces (Ax, Ax 0 — y) m = 0 para toda Jc£F n . Luego, por el Lema 1, 
tenemos que (jc, A*(Ax 0 — y)) n = 0 para toda Jc£F n ; esto es, A*(Ax 0 — 
— y) = 0. Así, únicamente tenemos que encontrar una solución para 
A*AX = A*y. Si, además, suponemos que rango(^) = n, entonces por 
el Lema 2 tenemos que jc 0 = (A *A )~'A*y. Podemos resumir esta expo- 
sición en el teorema siguiente. 
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Teo rema 7.28. Sea AÇM mx n(F) y yÇF m . Entonces, existe x 0 e F n /a/ 

(A*A)x 0 = A*y y ||Ax 0 — y|| < ||Ax — y|| para toda x£F n . Además, si 
rango(A) — n, entonces x 0 — (A*A) _1 A*y. 


Volviendo con nuestro investigador, supongamos que éste recopila los 
siguientes datos: (1, 2), (2, 3), (3, 5) y (4, 7). Entonces 


A = 


'ì 

2 1 


/2\ 

3 

3 'J 

il 

1 

5 

\ 7 / 


por lo tanto 


A*A 


_ /1 2 3 4\ 2 1 _ /30 10\ 

~ \1 1 1 1/ 3 1 \10 4/' 


y entonces 


Por consiguiente 


(A*A)~ 


1 ( 4 -10\ 

20 V” 10 30/ 


/c\ j_/ 4 - 10\/1 2 3 4\ 3 _ /1.7\ 
\rf/ 20 \— 10 30 /\ 1 111/5 \0 ) 


1 2\ 
3 
5 

\7/ 


Así, la recta y = 1.7/ es la recta de mínimos cuadrados. E1 error E puede 
calcularse directamente como || Ax 0 — y|! 2 = 0.3. 

E1 método anterior puede también ser aplicado si el investigador desea 
ajustar una parábola y — cí 2 + dt + e a los datos. En este caso, él utili- 
zaría 

/'î 1\ 


Vm t m 1/ 

como la matriz A. 

Finalmente, supóngase en el caso lineal que el investigador escogió 
sus instantes, / i; para satisfacer la expresión 


2 u = o. 

i -1 

Entonces, las dos columnas de A serían ortogonales y A*A seria una matriz 
diagonal. (Véase el Ejercicio 1.) Esto, por supuesto, simplificaría mucho 
los cálculos. 



466 Espacios con producto interior 


Soluciones mtnimas 

En la exposición anterior mostramos que, si rango(/4) — n , entonces existe 
un elemento jr 0 €F n único tal que Ax 0 es el punto en W más cercano a y. 
Por supuesto, si rango(/4) < n , existirá un número infinito de estos vec- 
tores. Es a menudo deseable encontrar un vector tal que su norma sea 
mínima. Para lo siguiente, haremos que b = Ax 0 ; esto es, b = T (y), don- 
de T es la proyección ortogonal sobre W. Entonces, el sistema AX = b 
tiene al menos una solución. Una solución s se llama solución mînima si 
\'s l < !!«!? para todas las otras soluciones u de AX — b. 

Teorema 7.29. Sean AÇM mxll (F) y b£F m . Supóngase que AX = b //ene «/ 
menos una solución. Enîonces 

(a) Existe exaciamente una solucián mínima s de AX = b y 
s £ R(L A .). 

(b) s es la única solución de AX — b ubicada en R(L A *)/ esto es, 
si u es una solución de (AA*)X = b, entonces s = A*u. 

demostración. Para simplicidad en la notación, escribiremos N(4) = 
= N(L^) y R(,4*) = R(L^.). Por el Teorema 7.6 y el Ejercicio 12 de la 
Sección 7.3, tenemos que F n = N(^) 1 © N(/l) = R(/4*) © N(/í). Sea x 
una solución cualquiera de AX — b. Entonces, por lo anterior, x = s + y, 
donde s£R(A*) y y ÇN(y4). Nótese que b = Ax = As + Ay = ,4j, de 
manera que 5 es una solución de /lA' = b que está en R(v4*). Para de- 
mostrar (a), necesitamos únicamente demostrar que s es la única soîución 
mínima. Sea v cualquier solución de AX = b. Por el Teorema 3.8, tene- 
mos que v = s + i/, donde u £N(/4). Como s e R(/4*) = N(/4) x , tenemos, 
de acuerdo con el Ejercicio 10 de la Sección 7.1, que ||v|| 2 = \\s + u\r = 
= ! 's \+ I \u\ I 2 > Ijsij 2 . Luego, s es una solución mínima. Podemos ver 
igualmente del cálculo anterior que si ||vj| = ||j||, entonces u = 0 y v = s. 
Por lo tanto, j es la única solución mínima de AX = b. 

Con el objeto de demostrar el inciso (b) supondremos que v es tam- 
bién una solución de AX = b que está en R(/4*). Entonces v — jÇR(^*) 
fì N(>í) = {0}, y así v = s. ■ 

Ejemplo 32. Considérese el sistema 

x + 2y + 2 = 4 

< x — y + 2z = — 11 

x+ 5y = 19 . 

Sean 
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Para encontrar la solución mínima del sistema, debemos encontrar una 
solución de AA*X = b. Ahora bien, 


(ï : 'í 


por Io que consideraremos el sistema 

6x + y + ìlz = 4 

< x + 6y — 4z = — 11 
11* - 4y + 26z = 19, 

para el cual una solución es 



(Cualquier solución es suficiente.) Por lo tanto, 



es la solución mínima del sistema dado. 


EJERCICIOS 

1. Demostrar que si A es una matriz de m x n cuyas columnas son ortogona- 
les, entonces A*A es una matriz diagonal. 

2. Dados los datos ( — 3, 9), (—2, 6), (0, 2) y (1, 1), encontrar la parábola 
que proporcione el ajuste de mínimos cuadrados. Calcular E. 

3. Calcular la solución mínima de 

' x + 2y — z = 1 
<2x + 3y + z = 2 
Ax + ly — z — 4. 

4. Sea A una matriz de m x n. Demostrar que ( Ax , y) m = (*, A*y) n para 
x£F n e y£ P n , completando así la demostración del Lema 1. 

5. Para la recta de mínimos cuadrados y — ct + d correspondiente a las m 
observaciones (t l9 yj, . . . , (t m? y m ), utilizar el Teorema 7.28 para derivar 
las ecuaciones normales: 
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\t=i / \i=i / i = i 

y 

/m \ m 

( 2 íi ) C + md — 2 y,- 

Estas ecuaciones también se pueden obtener haciendo cada una de las deri- 
vadas parciales del error E iguales a cero. 


7.11* FORMAS BILINEALES Y CUADRATICAS 

Existe una cierta clase de funciones de valor escalar de dos variables 
definidas en un espacio vectorial que a menudo se considera en el estudio 
de temas tan diversos como la geometría y el cálculo en varias variables. 
Esta es la clase de “formas bilineales”. Estudiaremos las propiedades bási- 
cas de esta clase dando importancia especial a las formas bilineales simé- 
tricas y consideraremos algunas de sus aplicaciones a las superficies cua- 
dráticas y al cálculo en varias variables. 

A lo largo de esta seeción todas las bases serán consideradas como 
bases ordenadas. 

Definición. Sea V un espacio vectorial sobre urt campo F. Una función H que 
va del conjunto V x V de pares ordenados de vectores en V a F, se llama 
forma bilineal en V si H es lineal en cada variable cuando la otra variable 
se mantiene fija, esto es, si 

(a) H(aXx + x 2 , y) = aH(x 1? y) + H(x 2 , y) para toda x l5 x 2 , 
y € V y a £F. 

(b) H(x, ay^ + y 2 ) — aH(x, yj + H(x, y 2 ) para toda x, y l9 
y 2 € V y a C F. 

Representaremos al conjunto de formas bilineales en V mediante ®(V). 
Obsérvese que un producto interior en un espacio real V es una forma 
bilineal. 

Ejemplo 33. Defínase una función H : R 2 x R 2 —> R mediante 

H (2)’{ b bl} = 2aibl + 3aibi + Aa ' ibl ~ para (£)’(£) €R2 ‘ 

Podemos verificar directamente que H es una forma bilineal en R-. Será 
más ilustrativo y menos tedioso, sin embargo, observar que si 
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entonces 


H(x, y ) = x f Ay. 

La bilinealidad de H se infiere ahora directamente de la propiedad distri- 
butiva de la multiplicación de matrices sobre la suma de matrices. 

La forma bilineal anterior es un caso especial de la siguiente situación 
que es más general. 

Ejemplo 34. Sea V = F 11 el espacio vectorial de todos los vectores colum- 
na de longitud n sobre un campo F. Para cualquier matriz A de n x n 
con elementos de F, defínase a H: Vx mediante 

H(x, y) = x f Ay para *, yÇV. 

Nótese que, como x y y son matrices de n x 1 y A es una matriz de 
n x n, H(x, y) es una matriz de 1 x 1 para toda x, y£W. Identificamos 
a esta matriz con su elemento único. Como en el Ejemplo 33, la bilinea- 
lidad de H se obtiene de la propiedad distributiva de la multiplicación 
sobre la suma de matrices. Por ejemplo, si aÇ_F y x u x->, yÇV, entonces 

H(ax x + x 2 , y) = (ax x + x 2 ) f Ay = (ax[ + x[)Ay 
= ax\Ay + x\Ay 
— aH(x l9 y) + H(x 2 , y). 

Enumeraremos ahora algunas propiedades que tienen todas las formas 
bilineales. Las demostraciones se dejan al lector. (Véase Ejercicio 2.) 

Para cualquier forma bilineal H en un espacio vectorial V sobre un 
campo F: 

1. Si para cualquier x Ç V las funciones l x , R x : V —> F se definen me- 
diante L(y) ~ H(x, y) y R x (y) = H(y, x) para toda yÇV, en- 
tonces L x y R r son lineales. 

2. H(0, x) — H(x, 0) = 0 para toda jc£V. 

3. Si x, y, z, H>£V, entonces 

H(x + y, z + w) = H(x, z) + H(x, w) + H(y, z) + H(y, w). 

4. Si J: V x V F está definida mediante J(x , y) = H(y, ;r), % en- 
tonces J es una forma bilineal. 

Para un espacio vectorial V, H U H 2 e (B(V) y cualquier escalar a, defi- 
namos la suma H x + H> y el producto aH x mediante las ecuaciones 

(H ± + H>)(x, y) = H { (x, y) + H>(x, y) 

y 


(aH x )(x, y) = a(H x (x, y)) para toda x, y£V. 
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Es un ejercicio sencillo verificar que H^ + H 2 y aH x son de nuevo for- 
mas bilineales. No es de sorprenderse que CB(V) sea un espacio vectoriaî 
con respecto a estas operaciones. 

Teorema 7.30. Para cualquier espacio vectorial V, CB(V) es un espacio vectorial 
con respecto a las anteriores definiciones de surna y de producto. 

demostración. Ejercicio. 

Sea V im espacio vectorial n-dimensional con una base /? — [x u jc 2 , ..., 
x n }. Para cualquier forma bilineal H e CB(V) podemos asociar con H 
una matriz A de n x n cuyo elemento del renglón i y columna / esté defi- 
nido mediante 

Aij = H(x u Xj) para toda /, / = 1, 2, . .. , n. 

Definición. La matriz anterior A será llamada la representación matricial de H 
con respecto a la base p. 

Podemos, por lo tanto, definir un mapeo de CB(V) en M nKn (F), don- 
de F es el campo de escalares para V, tal que para cualquier H e CB(V), 
ỳp(H) — A, donde A es la representación matricial H con respecto a /3. 

Ejemplo 35. Considérese la forma bilineal de H del Ejemplo 33. Sean 

»={(!)•(-!)} y B=MH) - 

Entonces 

'■*-"((!)■ (-!))- , - j+4+, - 4> 

- «((_!)> (;)) - 2 + ^ - + ■ - 2, 

*•■="((-!)■(-!))- 2 - 3 - 4 -‘=- 6 ' 

Así, 


»«<">=(! -t} 

Si y es la base estándar para R 2 , el lector podrá verificar que 
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T eorema 7.31. Para cualquier espacio vecíorial n-dimensional V sobre un 
campo F y cualquier base /3 para V, </ y es un isomorfismo de (B(V) en 
AA nxn (F). 

demostración. Dejaremos al lector 'a demostración de que ýp es una 
transformación lineal. 

Para demostrar que ^ es uno-a-uno, supóngase que H e ®(V) y 
't’ft(H) = O, la matriz nula. Deseamos demostrar que H es trivial, esto 
es, H(x, y) =0 para toda x, y£V. Fíjese una x, £ /? y recuérdese la fun- 
ción L* ( : V-»F definida mediante U ( (x) = H(x u x) para toda x£V. 
De acuerdo con la propiedad 1 dada en la p. 469, L I( es lineal; por hi- 
pótesis, Lj, (Xj ) = H(x ,, Xj) = 0 para toda *, £/?. Por lo tanto, L x , es 
la transformación nula de V en F. Entonces 

H(x h x) = U,(x) = 0 para toda *€V y XiZp. (18) 

Fïjese luego una y Ç V arbitraria y recuérdese el mapeo R 7 : V —* F 
definido mediante R r (x) = H(x, y) para toda x € V. De nuevo R r es lineal. 
Pero por la Ecuación (18) R y (xì) = H(x h .y) = 0 para cualquier £/ 3. 
Luego, R y es trivial, y concluimos que H(x, y) = R y (x) = 0 para toda 
x, y £ V. Así, tenemos que H es trivial y tpp es, por lo tanto, uno-a-uno. 

Para demostrar que es sobreyectivo, sea A £M n * n (F). Recuérdese 
el isomorfismo </> 0 : V —» F" definido en la Sección 2.4. Para x Ç V toma- 
remos a <j>p(x) £ F“ como un vector columna. Defínase im mapeo H: 
V x V: -* F mediante 

H(x, y) = [<f>p(x)YA [^(y)] para toda x, y£V. 

Por el Ejemplo 34, H e «(V). Demostraremos que ^(H) = A. Si x h 
Xj €/?, entonces <j>p(Xi) = e, y <f>$(xj) = e h En consecuencia, para cuales- 
quiera i y /, 

H(x h Xj) = [<t>p(Xi)] 'AlïpUj)] = e\Aej = A^j. 

Concluimos que ý$(H) — A y, por lo tanto, <p-p es sobreyectivo. | 

Corolario 1 . Para cualquier espacio vectorial n-dimensional V, <B(V) es de di- 
mensión n 2 . 

demostración. Ejercicio. 

E1 corolario siguiente queda establecido fácilmente al repasar la de- 
mostración del Teorema 7.31. 

Corolario 2. Sea V un espacio vectorial n-dimensional sobre el campo F con 
una base fi. Si H e ®(V) y A ÇM nxn (F), entonces ^p(H) = A si y sólo si 
H(x, y) = [</> 0 (x)]‘A[</>j 3 (y)] para toda x, y€V. 

E1 siguiente corolario es ahora una consecuencia inmediata del Coro- 
lario 2 . 
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Corolario 3. Para cualquier carnpo F, un eníero positivo n y H e CB(F n ), exis- 
te una matriz única A£M 11 X 11 (F), a saber A = ^(H), tal que 

H(x, y) = x { Ay para toda x, y Ç F n , 
donde f$ es la base estándar para F n . 

Parece existir una analogía entre las formas bilineales y los opera- 
dores lineales en el hecho de que ambos están asociados con una matriz 
cuadrada única y en que esta correspondencia depende de la selección de 
una base para el espacio vectorial. Tal como en el caso de los operadores, 
uno puede hacerse la pregunta: ^Cómo se modifica la matriz correspon- 
diente a una forma bilineal fija cuando se cambia la base? Como ya lo 
hemos visto, cuando surgió la pregunta para el caso de los operadores 
lineales, ésta condujo al estudio de la relación de similitud en las matri- 
ces cuadradas. En el caso de las formas bilineales nos orientaremos al 
estudio de otra relación en las matrices cuadradas, la relación de “con- 
gruencia”. 

Definición. Se dice que dos matrices A, BÇM llxll (F) son congruentes si existe 
una matriz invertible Q£M nxn (F) tal que 

Q 4 AQ = B. 

Se puede ver fácilmente que la congruencia es una relación de equiva- 
lencia. (Véase el Ejercicio 11.) 

E1 teorema siguiente relaciona la congruencia con la representación 
matricial de una forma bilineal. 

Teorema 7.3 2. Sea V un espacio vectorial dimensionalmente finito con bases 
P = { x^, x 2 , . . . , x,J y y — (y^, y 2 , , y n } y sea Q la matriz de cambio 

de coordenadas que transforma las coordenadas de y en coordenadas de 
/3. Entonces, para cualquier H G CB(V), ^ y (H) = Qy,?(H)Q. En particu- 
lar , \py (H) y ^(H) son congruentes. 

demostración. Existen fundamentalmente dos demostraciones de este 
teorema. La primera implica un cálculo directo, mientras que la otra se 
obtiene inmediatamente de una observación acuciosa. Presentaremos la 
primera demostración y dejaremos la última como ejercicio. (Véase el 
Ejercicio 12.) 

Supóngase que A = ỳ$(H) y B — ip y (H). Entonces, para cualesquiera 
i y j tales que 1 < /, / < n , 

n n 

yi = 2 QkiX k y y, = 2 Qr}X r . 

fc = ì r = ì 
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Así, 

B tJ = H(y t ,y,) = QkiX k ,y y ) 

= J] Q kt ti(x k ,y,) 

Jt=l \ r= 1 / 

= 2 2 QrjH *r) 

Jt=l r=l 

" Qki 2 Qrj^kr 

= 2 ôjt/ 2 ^krQrj 

k=l r— 1 

— Qki(AQ)kj 

= 2 = (Ô^fiV 

^=1 

Por lo tanto, B = Q^4(2. ■ 

E1 corolario siguiente es el recíproco del Teorema 7.32. 

Corolario. Sea A, B £M nxn (F). Si A y B son congruentes , entonces existen un 
espacio vectorial n-dimensional V sofrre F, bases p y y pam V, y w«a 
forma bilineal H en V, /a/es' 

*p(H) = A y ^y(H) = B. 

demostración. Supóngase que ô es una matr i z invertible para la que 
B = QMQ. Sean V = F n , = {^, e 2 , . . . , e n ) la base estándar para F n 
y H la preimagen de A bajo ýp. Sea y = {Q 1 , 2% . . • , ô w } et conjunto 
de columnas de Q. Entonces, y es una base para F n y Q es la matriz de 
cambio de coordenadas que transforma las coordenadas de y en coorde- 
nadas de /3. Luego, por el Teorema 7.32, B = Q*AQ = Q { ỳp(H)Q = 

= M*n- ■ 

Tal como el problema de diagonalización para operadores lineales, 
existe un problema de “diagonalización” semejante para formas bilinea- 
les, a saber, el problema de la determinación de aquellas formas bilineales 
para las que existen representaciones matriciales diagonales. Como vere- 
mos, las formas bilineales “diagonalizables” son aquellas que son “si- 
métricas”. 

Detinición. Vna forma bilineal H sobre un espacio vectorial V se llama simé- 
trica, si H(x, y) = H(y, x) para toda x, y £ V. 
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Como eî nombre lo sugiere, las formas bilineales simétricas corres- 
ponden a matrices simétricas. 

Teorema 7.33. Sea V un espacio vectorial dimensionalmente finito. Para 
H G <B(V) tas siguientes proposiciones son equivalentes: 

(a) H es simétrica. 

(b) Para cualquier base y para V, ỳy(H) es una matriz simétrica. 

(c) Existe una base /? para V tal que ^(H) es una matriz simétrica. 

demostración. Primero demostraremos que (a) implica a (b). Supón- 
gase que H es simétrica. Sea y = [y u . . . , y n ) una base para V, y 
sea B = ỳ y (H). Entonces, para cualquier / y cualquier /, B ìỳ = H(y h y$) = 
~ H(yj> yô ~ Bjj. Luego, B es una matriz simétrica, demostrando así 
a (b). 

Claramente (b) implica a (c). 

Finalmente, demostraremos que (c) implica a (a). Supóngase que, 
para alguna base /? ~ [x u x 2y . . . , x n } y ^(H) — A es una matriz simé- 
trica. Definase a /: V x V —> F, donde F es el campo de los escalares 
para V, mediante J(x, y) = H(y , jc) para toda *, y£V. Por la propiedad 
4 dada en la p. 469, J e ®(V). Sea C ,= ỳ$(J). Entonces, para cualquier 
/ y cualquier /, 

E'ij /(*,, Xj) H(xj , Xi) sáij- 

Por Io tanto, C = /4. Como ýp es uno-a-uno, concluimos que J = H y, por 
lo tanto, //(y, *) = /(a:, y) = //(*, y) para toda x, yÇV y entonces // 
es simétrica, lo que demuestra a (a). ■ 

Definición. Una forma bilineal H en un espacio vectorial dimensionalmente fi - 
rito V /temû diagonalizable j/ existe una base p para V tal que ^(H) 
sea una rnatriz diagonal. 

Corolario. Sea V un espacio vectorial dimensionalmente finito. Para cualquier 
H E (B(V), si H es diagonalizable, entonces H es simétrica. 

demostración. Supóngase que H es diagonalizable. Entonces, existe 
una base /3 para V tal que ỳ$(H) = D es una matriz diagonal. Trivial- 
mente, D es una matriz simétrica. Luego, de acuerdo con el Teorema 7.33, 
H es simétrica. ■ 

Desafortunadamente, la recíproca no es cierta, como se ilustra en el 
ejemplo siguiente. 

Ejemplo 36. Sea F = Z 2 (véase Apéndice C), y sea V = F 2 . Defínase a 
H: VxV^f mediante 


H 


a 2 


b\ 

b 2 


= aj)> -f a 2 bi. 
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Se ve claramente que H es simétrica. De hecho, si /3 es la base estándar 
para F 2 , entonces 

es una matriz simétrica. E>emostraremos que eî considerar que H es 
diagonalizable conduce a una contradicción. 

Supóngase que H es diagonalizable. Entonces, existe una base y para 
F 2 tal que B = ỳ y (H) es una matriz diagonal. Luego, por el Teorema 7.32, 
existe una matriz invertible Q tal que B = Q f AQ. Como Q es invertible, 
rango(B) — rango(/l) = 2. Luego, B es una matriz diagonal cuyos ele- 
mentos de la diagonal son no nulos. Como el único elemento no nulo 
de F es 1 , 

-(î ”)• 

Supóngase 

«■(: :)■ 

Entonces 

/1 0 \ _ _ _ nt Jn _ (a c \/0 1 \/ a b\ _ f ac + ac bc + ad\ 

(o 1/ ^ @ \b <i/\l o)\c d) \bc + ad bd + bdj' 

Pero p 4- p = 0 para toda p £ F y entonces ac + ac = 0. Así, compa- 

rando los elementos superiores izquierdos de las matrices de la ecuación 

anterior, concluimos que 1 = 0, lo que es una contradicción. En conse- 
cuencia, H no es diagonalizable. 

La forma bilineal del Ejemplo 36 es anómala. La razón de que no 
sea diagonalizable parte del hecho de que el campo escalar Z 2 es de 
característica dos. Si F no es de característica dos, entonces 1 + 1 es inver- 
tible. Bajo estas circunstancias representaremos a ‘T + 1” como “2” y su 
inverso multiplicativo como i. 

Antes de demostrar la recíproca del corolario del Teorema 7.33 para 
campos escalares distintos a los de característica dos, debemos establecer 
el lema siguiente. 

Lema. Sea H una forma bilineal simétrica no trivial en un espacio vectorial V 
sobre un campo F de caraclerística distinta de dos. Entonces, existe un 
elemento x£V tal que H(x, x) 7 ^ 0. 

demostración. Supóngase que para algunas v, w£V, H(v , vv) 7^ 0. Si 
H(v, v)^0o H(w, w) 7 ^ 0 , no hay nada que demostrar. De lo contra- 
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rio, supóngase que H(v, v) = H(w , w) = 0. Haciendo jc = v + w, tene- 
mos que 


H(x, x) = H(v, v) 4- H(v, w) + H(w, v) + H(w, w) 

= 2 H(v, w) =£ 0 

puesto que 2^0 y H(v, w) =+ 0. ■ 

Teorema 7.34. Sea V un espacio vectorial dimensionalmente finito sobre un 
campo F de característica distinta de dos. Entonces, toda forma simétrica 
bilineal en V es diagonalizable. 

demostración. Utilizaremos inducción matemática sobre n = dim(V). 
Si n ~ 1? todo miembro de (B(V) es diagonalizable. Supóngase que el teo- 
rema es válido para espacios vectoriales de dimensión menor que n para 
algún entero fijo n > 1 . Si H es la forma bilineal trivial, entonces, por 
supuesto, H es diagonalizable. Supóngase que H es simétrica y no trivial. 
Entonces, de acuerdo con el lema, existe un elemento x £V (necesaria- 
mente no nulo) tal que H(x, x) =£0. Defínase a L: V=>F mediante 
H ( x , z ) para toda z£V. Entonces, L es lineal y como L(jc) = 
= H(x, x) ^ézO, L es no trivial. En consecuencia, rango(L) = 1 y, por 
Io tanto, dim(N(L)) = n — 1. La restricción de H a N(L) es evidente- 
mente una forma bilineal simétrica en un espacio vectorial de dimensión 
n — \. Luego, por la hipótesis de inducción, existe una base {x l9 jc 2 , . . . , 
* M -i} para N(L) tal que H(xi, x } ) = 0 para i =£ j (1 < i, j < n — 1 ). Há- 
gase x n = x. Entonces x n #N(l), y por lo tanto /3 = {x u ... , x n ) es una 
base para V. También H(x t , x n ) = H(x n , x t ) = 0 para / = 1 , 2, . . . , 
n — \. Concluimos que ỳp(H) es una matriz diagonal y entonces H es 
diagonalizable. ■ 

Corolario. Sea F un campo que no tiene característica dos. Si A£AA nxn (F) es 
una matriz simétrica, entonces A es congruente con una matriz diagonal. 

demostración. Ejercicio. 

Sea A una matriz simétrica de n x n con elementos de un campo que 
no tenga característica dos. Por el corolario del Teorema 7.34, A es 
congruente con una matriz diagonal. Mostraremos cómo encontrar una 
matriz diagonal D y una matriz invertible Q tales que Q f AQ = D. EI lec- 
tor debería repasar la Sección 3.1 para recordar la relación entre Ias 
matrices elementales y las operaciones elementales con matrices. 

Si E es una matriz elemental de n x n, entonces AE se obtiene de 
A mediante una cierta operación elemental con columnas en A. De acuer- 
do con el Ejercicio 20, E'A se obtiene a partir de A por medio de la 
misma operación realizada en los renglones en vez de en las columnas 
de A. Entonces, E'AE se obtiene a partir de A realizando una elemental 
operación en Ias columnas de A, y luego realizando la misma operación 
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en los renglones de la matriz AE. (Nótese que puede invertirse el orden 
de las operaciones.) Ahora supóngase que Q es una matriz invertible 
y que D es una matriz diagonal tal que Q*AQ — D. Por el Corolario 3 
del Teorema 3.5, Q es un producto de matrices elementales, Q = E,E, . . . 

. . . E k . Entonces, Z> = Q f AQ = ... E^AE^E^ ■ ■ ■ E k . 

Sobre la base de la ecuación anterior,'concluimos que por medio de 
algunas operaciones elementales con columnas y las operaciones corres- 
pondientes con renglones, A puede ser transformada en una matriz dia- 
gonal D. Además, si E„ E 2 , ... , E k son las matrices elementales corres- 
pondientes a las operaciones elementales con columnas (indexadas en 
el orden en que han de ser realizadas) y si Q = EìE 2 ... E k , entonces 
Q‘AQ = D. 

E1 enunciado anterior proporciona la clave para encontrar D y Q 
para una A dada. 

Ejemplo 37. Supóngase que 

-G ?)• 

Empezamos utilizando operaciones elementales con columnas para insertar 
un cero en el primer renglón, segunda columna; en este caso debemos 
restar dos veces la primera columna de A de la segunda columna de A. 
La operación correspondiente con renglones implicaría restar dos veces 
el primer renglón del segundo renglón. Sea E, la matriz elemental corres- 
pondiente a la anterior operación elemental con columnas. Entonces, 



Obsérvese que como E, produjo un cero en el renglón 1, columna 2, E‘ 
produjo un cero en el renglón 2, columna 1. Luego, para 



Es conveniente tener ±1 en la posición renglón 1, columna 1, y utilizarlo 
para eliminar a todos los demás elementos del primer renglón y de la 
primera columna de A. Entonces, principiemos intercambiando la pn- 
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mera y la segunda columnas de A. La matriz elemental que corresponde 
a esta operación con columnas es 


Claramente 



,-l 1 3\ 

E\AE,=\ 10 2- 

\ 3 2 4/ 

Esta matriz se obtiene intercambiando las dos primeras columnas de A 
para obtener AE y luego intercambiando los dos primeros renglones de 
AE. Luego, produzcamos un cero en el primer renglón, segunda columna 
y en el segundo renglón, primera columna de E[AE^ sumando la prime- 
ra columna de E[AE x a la segunda columna de E[AE y continuando 
esta operación con su correspondiente operación con renglones. Finalmen- 
te, sumemos tres veces la primera columna a la tercera columna y prosi- 
gamos con la operación correspondiente con renglones. Nótese que las 
operaciones con columnas pueden realizarse en sucesión antes de reali- 
zar las operaciones con renglones. Entonces, si 


E 2 = 




/-1 0 0 \ 
E’.E’^E’.AE^E, = ( 0 1 5 • 

\ 0 5 13/ 


E1 Iector puede ver ahora fácilmente que haciendo 


tenemos 


,1 0 
E< = 0 1 
\o 0 



/-10 0 \ 

E’^E’.E’^AE^E^E, = I 0 1 0. 

\ 0 0 — 12 / 

Entonces con Q = EiE 2 E 3 iì 4 y 


\ 0 0 



Q‘AQ = D. 
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E1 lector deberá justificar el siguiente método (semejante al introdu- 
cido en la Sección 3.2 para calcular la inversa de una matriz) para calcu- 
lar Q ú (y por lo tanto Q) sin registrar por separado a cada una de las 
matrices elementales: utilizar una secuencia de operaciones elementales 
con columnas seguidas de las correspondientes operaciones elementa- 
les con renglones para modificar la matriz aumentada (A\I) en la for- 
ma (D\B), donde D es una matriz diagonal. Entonces B = Q f . 

En el ejemplo anterior este método debería producir la siguiente se- 
cuencia de matrices: 


(A\I) = 


Por lo tanto, 


D = 



/ 0 

1 

2 

1 

0 

°\ 

/ 1 

0 

2 

1 

0 


-1 

3 

0 

1 

4 

-1 

1 

3 

0 

1 

\ 2 

3 

4 

0 

0 

1 / 

\ 3 

2 

4 

0 

0 


-1 0 




°o) 

- 12 / 


< 2 ' = 



Formas cuadráticas 

Asociadas con las formas bilineales simétricas existen funciones llamadas 
“formas cuadráticas”. 

Definición. Sea V un espacio vectorial sobre un campo F. Una función K: 
V —> F se llama forma cuadrática si existe una forma bilineal simétrica 
H e (B(V) tal que 


K(x) = H(x, x) para toda x £ V. 


(19) 
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Si el campo F no es de característica dos, existe una correspondencia 
uno-a-uno entre las formas bilineales simétricas y las formas cuadráticas 
dadas por la Ecuación (19). De hecho, si K es una forma cuadrática en 
un espacio vectorial V sobre un campo F cuya característica no sea dos, 
y si K(x) = H(x, x ) para alguna forma bilineal simétrica en V, entonces 

H(x, y ) = ì[K(x + y) - K(x) - K(y)]. (20) 

Véase el Ejercicio 15 para más detalles. 

Ejemplo 38. Ciertamente, el ejemplo clásico de una forma cuadrática es 
el del polinomio de segundo grado homogéneo de varias variables. Dadas 
las variables t u t 2 , . . . , t n . que toman valores en un campo F cuya carac- 
terística no sea dos y los escalares (no necesariamente distintos) aa( 1 < 
</</<«), defínase el polinomio 

f«L ^2> • • • > O “ 2 a ljtltj‘ 
i<.J 

Sea K: F n -^F la forma cuadrática definida mediante K(c u c,, ... , 

Cn) — f(Ci, C 2 , , C n ). 


Cualquier polinomio de la forma anterior se denomina polinomio homo - 
géneo de segundo grctdo en n variables. De hecho, si /3 es la base estándar 
para F n , entonces la forma bilineal simétrica correspondiente a la forma 
cuadrática anterior es H, donde ỳ$(H) = A y 


A j j A j j 




si i = j 

si i /• 


Para ver esto, simplemente aplíquese la Ecuación (20) para obtener 
H(e ( , e } ) = Ajj a partir de la forma cuadrática K y verifíquese que 
f(ti, . . . , t n ) es calculable a partir de H por medio de la Ecuación (19). 
En particular, dado el polinomio 


f(tu h, h) — 2 /- — f + 6 Ut 2 — 4 ut ò 
con coeficientes reales, sea 

/2 3 0 

A = 3 -1 -2 
\0 -2 0 

Haciendo H(x, y) — x f Ay para toda x, y £ R 3 , vemos que 

1 (* 1 , to, 4) = ( 4 , t 2 , t s )A ^4^ para ^4^ ÇR 3 . 
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Formas cuadráticas sobre el campo R 

Como las matrices simétricas sobre R son “ortogonalmente diagonaliza- 
bles” (véase el Teorema 7.21), la teoría de las formas bilineales simétricas 
y de las formas cuadráticas en espacios vectoriales dimensionalmente fini- 
tos sobre R es especialmente adecuada. E1 teorema siguiente y su corola- 
rio se encuentran definitivamente entre los resultados más útiles en la 
teoría de las formas bilineales y cuadráticas. 

Teo rema 7.35. Sea V un espacio real dimensionalmente finito con producto 
interior, y sea H una forma bilineal simétrica en V. Entonces, existe una 
base ortonormal f3 para V tal que ýp(H) es una matriz diagonal. 

demostración. Tómese cualquier base ortonormal y — {x l5 x 2 , . . . x v ) 
para V. Sea A — ipyiH). Como A es una matriz simétrica, es autoadjunta 
con respecto al producto interior en V. Aplicando el Teorema 7.21, pode- 
mos encontrar una matriz ortogonal Q tal que D = Q f AQ sea una matriz 
diagonal. Para / = 1, 2, . .. , n, defínase 

n 

ys 2 QìjXì- 

i -1 

Es una operación sencilla verificar que /3 = {y u y 2 , ... , y n } es una base 
ortonormal para V. Además, debido a la manera en que f3 está definida, 
Q es la matriz de cambio de coordenadas que transforma las coordenadas 
de /3 en coordenadas de y. Por lo tanto, de acuerdo con el Teorema 7.32, 

MH) = GV (H)Q= Q f AQ = D, 
la cual es una matriz diagonal. ■ 

Corolario . Sea K una forma cuadrática en un espacio reaî con producto interior 
dimensionalmente finito V. Existe una base ortonormal /3 = {x u x 2 , ... , 
x n ) para V y escalares A 1? A 2 , . . . , A n (no necesariamente distintos), tales 
que si x £ V y 


n 

X = 2 SiXi, Si£R, 

i = 1 


entonces 


K(x) = 2A,S^. 

i = 1 

De hecho, si H es la jorma bilineal simétrica determinada por K, en- 
tonces fí puede escogerse para que sea cualquier base ortonormal para 
V para la cual #(H) es una matriz diagonal. 



Espacios con producto interior 


demostración. Sea H la forma bilineal simétrica para la cual £(*) = 
— H(x, j:) para toda xÇ,V. De acuerdo con el Teorema 7.35, existe una 
base ortonormal /3 — [x u x 2 , , x n } para V para la cual 


= d 


Sea x Ç V y supóngase que 


Mi 0 
0 X 2 


\0 0 


Entonces 


n 

X = 2 ‘S'i-Ti* 
i = 1 


°\ 

0 

J 


K(x) = //(*, x) = [0/x)]'/)^*)] = (í„ 



\sj 


Ejemplo 39. Para el polinomio real homogéneo de grado 2 

f(t u 4) = 5t* + 2Ç + 4tit» (21) 

encontraremos una base ortonormal /3 — {a:,, x 2 ) para R 2 y escalares À, 
y À 2 tales que si 


(4) €R2 Y (4) ~ í,_ri + Í2X2 ’ 

entonces f(t x , t 2 ) — À,.s 2 + à 2 í 2 . Podemos pensar en í, y j 2 como las 
coordenadas de 


G) 

relativas a /3. Así, el polinomio f(t,, t 2 ), como expresión que involucra 
a las coordenadas de un punto con respecto a la base estándar para R 2 , 
se transforma en un nuevo polinomio g(s u s 2 ) = à,í 2 + À 2 s 2 interpretado 
como una expresión que involucra a las coordenadas relativas de im punto 
a la nueva base /3. 

Sea H la forma bilineal simétrica correspondiente a la forma cuadrá- 
tica definida por la Ecuación (21). Si y es la base estándar para R 2 , 
entonces 
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Ahora encontraremos una matriz ortogonal Q para la cual Q*AQ sea una 
matriz diagonal. Como en la Sección 7.7, comenzaremos calculando 
una base ortonormal de vectores de l A . E1 polinomio característico h{t) 
de A es 


/i(r) = det^ 5 2 Z 2 2 _ = (/- 6)(í- 1). 

Por lo tanto, .= 6 y X 2 = 1 son los eigenvalores de A y cada uno 
de ellos tiene multiplicidad 1. Un cálculo sencillo da los eigenvectores 
correspondientes de norma uno, 

íl = 7?(>) y '- = 7l(-2)- 

Como X\ y x 2 son ortogonales, /3 = [x í9 x 2 } es una base ortonormal para 
R 2 . Haciendo 



vemos que Q es una matriz ortogonal y 

CM0= ( 0 ?)• 

Evidentemente, Q es también la matriz de cambio de coordenadas. Por 
lo tanto, 

M») '= Q'MH)Q ■= Q‘AQ = J) . 

Entonces, de acuerdo con el corolario del Teorema 7.35, para cualquier 

X 1 + S 2 X 2 £ 

K(x) i= 6s\ + Isl 
Y así g(s„ s 2 ) '= 6s\ + 1 s\. 

E1 ejemplo siguiente ilustra cómo puede aplicarse la teoría de las 
formas cuadráticas al problema de la descripción de las superficies cua- 
dráticas en R 3 . 


Ejemplo 40. Considérese la superfície S en R 3 definida por îa ecuación 
2t\ + ó/j/j + 5/f — 2/^/3 H - 2/f + 3/j — 2 /2 — /3 + 14 = Oj (22) 
es decir, S es el conjunto de todos ios elementos 
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que satisfacen la Ecuación (22). Si y es la base estándar para R 3 , enton- 
ces la Ecuación (22) es una ecuación que involucra a Ias coordenadas 
de los puntos en S relativos a y. Nos gustaría tomar una nueva base orto- 
normal /3 para R 3 tal que la ecuación que describe las coordenadas de 
cualquier punto de § relativas a /3 sea considerablemente más sencilla 
que la Ecuación (22). 

Principiamos con la observación de que los términos de segundo grado 
en el lado izquierdo de la Ecuación (22) se suman para formar una forma 
cuadrática en R 3 : 

^^2^ = 2 1 \ -j- 6í 1/2 -|- 5 í| — 2/2/3 -f- 2/3. 

En seguida diagonalizamos a K. Si H es la forma bilineal simétrica 
correspondiente a K y A = ỳ y (H), entonces 



Ahora bien, el polinomio característico de A es 
/2-t 3 0 \ 

A(/) = det 3 5 -/ -1 =-1(í-2)(/-7)/, 

\ 0 -1 2 — // 

y, por lo tanto, A tiene los eigenvalores A, = 2, À 2 = 7 y À 3 = 0. Un 
cálculo sencillo da los eigenvectores 



de norma 1 correspondientes a los eigenvalores respectivos. 
Ahora, hágase a /?i= x 2 , x 3 } y 


1 

3 

3 \ 

yiu 

V35 

VT? 

0 

5 

2 

V35 


3 

1 

I 

IvTO 

V35 

VT4/ 


Como en el Ejemplo 39, Q es la matriz de cambio de coordenadas que 
transforma las coordenadas de /3 en coordenadas de y y 

/2 0 0 \ 

VÁ.H) = Q'V r (H)Q = Q‘AQ= ío 7 0 ■ 

\o 0 0 / 
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Por el corolario del Teorema 7.35, si x = s^ + s 2 x 2 + s 3 x 3 , entonces 

K(x) = 2s\ + Isl (23) 

Ahora estamos preparados para transformar la Ecuación (22) en una 
ecuación que contenga coordenadas relativas a /?. 



Si x — s^Xx + s 2 x 2 + s 3 x 3f tenemos 


Entonces 


Por lo tanto 


\ty\ = S 1 


1 ì 


3 ì 


~ 3 \ 

vTD 


Í735 1 


vn 

0 

+ s 2 

5 

a /35 

+ *3 

2 

a/H 

3 1 


i I 


1 1 



\«/Î5l 


l/al 


1 + V35 y03 


t — 


5 s 2 j 2^3 


1 1 — 


3^1_ ^2 I s 3 


3 fj — 2/ 2 — / 3 = 


735^7h 

VTD V35 + 

14j 3 


a/I4 


= —a/ÏÏS 3 


(24) 


Combinando las Ecuaciones (22), (23) y (24), concluimos que si jc£R 3 
y jc = ^iJCi + s 2 x 2 + s 3 x 3 , entonces x e § si y sólo si 

2sf ~h 7s 2 — V 14s 3 + 14 — 0 o bien s 3 = A — s\ + —sl + V 14. 


(25) 


En consecuencia, si establecemos nuevos ejes jc', / y z! en las direcciones 
jci, jc 2 y jc 3 , respectivamente, la gráfica de la Ecuación (25) reescrita como 


z — 


V 14 V 14 ;-- 

^C*') 2 + ^(/) 2 + V14 


coincidirá con la superficie §• Así reconocemos que S es un paraboloide 
elíptico. Véase la Figura 7.9. 
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Concluiremos esta sección con una aplicación de la teoría de formas 
cuadráticas al cálculo en varias variables —la derivación de la prueba de 
la segunda derivada para puntos extremos locales de una función de va- 
rias variables. Supondremos que el lector posee un conocimiento en el 
cálculo de funciones de varias variables hasta un nivel del teorema de 
Taylor. E1 lector ya está, sin duda, familiarizado con la versión de una 
variable del teorema de Taylor. Para el enunciado y la demostración de la 
versión de varias variables, consúltese, por ejemplo, Advanced Calculus 
por Avner Friedman, Holt, Rinehart y Winston, Inc., 1971. 

Sea z = f(t u t 2 , . .. , t n ) una función de valor real de n variables para 
îa cual todas las derivadas parciales de tercer orden existen y son conti- 
nuas. Se dice que la función / tiene un máxirno local en el punto pÇ R" 
si existe un número positivo 8 para el cuai f(p ) </(*) siempre que 
||* — p\\ < 8. De la misma manera, se dice que / tiene un mínimo local 
en pÇR n si, para algún número 8 > 0, f(p) < f(x) siempre que ||x — 
— p|| < 8. Si / tiene un máximo o un mínimo local en p , decimos que / 
tiene un extremo local en p. Un punto p Ç R n se llama punto crítico de / si 
df(p)/dti — 0 para i = 1, 2, . .. , n. Es un hecho muy conocido que si / 
tiene un extremo local en un punto p Ç R n , entonces p es un punto crítico 



figura 7.9 
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de /. Ya que, si / tiene un extremo local en p, entonces para cualquier 
í = 1, 2, ... , n podemos definir una función <j>i de valor real de una 
variable mediante = f(p l9 p 2 , . .. , p»-i, t, p i+1 , ... , p n ), donde p, 
es la coordenada / de p para cada j. Evidentemente, <j>i tiene un extremo 
local en t = Pi . Luego, empleando argumentos ordinarios de cálculo de 
una variable, 


djnÌPi) _ df(p) _ 0 
dt dU 

Por lo tanto, p es un punto crítico de /. Desafortunadamente, los puntos 
críticos no son necesariamente extremos locales; pero la prueba de la 
segunda derivada nos proporciona condiciones adicionales bajo las cuales 
los puntos críticos son extremos locales. 

Teorema 7.36. (La prueba de lasegunda derivada.) Sea f(t x , t 2 , . . . , t n ) una 
función de valor real de n variables para la cual existen todas las derivadas 
parciales de tercer orden y son continuas. Sea p un punto crítico de f, y 
sea A la matriz de n x n cuyos elementos estén dados por 

A - ^(P) 

^ (0t, ) (Stj) ’ 

(Nótese que A es una matriz simétrica y, por îo tanîo, tiene eigenvalores 
reales.) Entonces 

(a) Si todos los eigenvalores de A son positivos, entonces f tiene un 
mínimo local en p. 

(b) Si todos los eigenvalores de A son negativos, enîonces f tiene un 
máximo local en p. 

(c) Si A tiene al menos un eigenvalor positivo y uno negativo, en- 
tonces f no tiene un extremo local en p (esto es, p es un punto 
silla de î). 

(d) Si rango(A) < n y A no tiene eigenvalores positivos ni negati- 
vos, entonces la prueba de la segunda derivada no permite obte- 
ner ninguna conciusión. 

demostración. Si p ^ 0, podemos definir una función g: R n -» R me- 
diante 

g(t U t 2 , . . . , t n ) = f(h + p l9 t 2 + p 2 , . . . , U + p n ) ~ f(Pu Pu • • • , Pn). 
Las siguientes observaciones pueden verificarse fácilmente: 

1. La función / tiene un máximo [mínimo] local en p si y sólo si g 
tiene un máximo [mínimo] local en 0 = (0, 0, . . . , 0). 

2. Las derivadas parciales de g en 0 coinciden con las correspon- 
dientes derivadas parciales de / en p. 
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3. 

4. 


0 es un punto crítico de g. 
_ 0*8(0) 


Aii 


para toda i y tcxia /. 


En vista de lo anterior podemos suponer sin perder generalidad que p = 0 

y que f(p) ~ 0. 

Aplicaremos en seguida el teorema de Taylor a / en 0 y concluiremos 
que existe una función de valor real S en R n tal que 


_ff(*) = ii m i = o 

lim ll~ll2 11111 #2 i i ^2 


1 \ + * * * + tl 


(26) 


” 3/(0) 

f(tl, ■ ■ - , l n ) — f(0) + 2 —-- ti + 


2 Idi oíì )(0t,) 1 ’] 


ì -1 0/i 2 |_i,_/=i (dî{) (dtj 

+ S(t l9 . . tn). 


(27) 


Bajo las hipótesis de que 0 es un punto crítico y f(0) = 0, la Ecua- 
ción (27) se reduce a 


f(ti,...., t n ) 


= _l r ŷ d2f(o) 

2 L iXi ídti)(dtj) li _ 


+ S(+ 


ín). ( 28 ) 


Definamos una forma cuadrática K: R n R mediante 


K 


/M 


\u 




à 2 f(0) 


2 ifiii (dt'Xdtj) 


t<tj 


(29) 


Sea H la forma bilineal simétrica correspondiente a K, y sea y la base 
estándar para R n . Es fácil verificar que ỳ y (H) = iA. Como A es auto- 
adjunta, el Teorema 7.21 muestra que existe una matriz ortogonal Q 
tal que 


Q'AQ 


fi 0 

0 a 2 


'0 0 


l\ 


XJ 


es una matriz diagonal cuyos elementos de Ia diagonal son los eigenvalores 
de A. Sea /3 = (*i, x 29 ... 9 * n } la base ortonormal para R n cuyo miem- 
bro i es Q l , la columna i de Q. Entonces, Q es Ia matriz de cambio de 
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coordenadas que transforma las coordenadas de /3 en coordenadas de y 
y, de acuerdo con el Teorema 7.32, 


= Qy r (H)Q = = 


T 0 
0 \ 


0' 

0 


^ 0 0 


k) 


Supóngase que A no es la matriz nula. Entonces, A tiene eigenvalores 
no nulos. Tómese un número positivo € tal que € < N/2 para todo 
y o. De acuerdo con la Ecuación (26) existe un número positivo 8 
tal que si x£R n y ||x|| < 8, entonces \S(x)\ < €||-*|| 2 - Ahora tómese cual- 
quier x para la cual ||x|| < 8. Entonces, de acuerdo con las Ecua- 
ciones (28) y (29) 

|/(jc) - K(x)\ = ]5(x)| < € ||*|| 2 

o bien 

K(x) - € ||x|| 2 < /(•*) < K( x ) + € ll-^ll 2 - 


Si 


n 

x = 2 *ì*ì> 

Ì rrl 


entonces 



K(x) 



(31) 


Luego, de acuerdo con las Ecuaciones (30) y (31) 

2 (y Xi “ £ ) s ‘ < f(x) < Ì(4*‘ + e ) 5 '' (32) 

Ahora supóngase que todos los eigenvalores de A son positivos. En- 
tonces, — € > 0 para toda i y, por lo tanto, por la desigualdad de 
la izquierda de la Ecuación (32), 


1(0) = o < 2 (-y'-i _ ^) s > < 1(x). 

Así, para ||jcj! < 8, 1(0) < f(x). Concluimos que f tiene un mínimo local 
en 0 . De la misma manera, mediante un argumento que involucre a la 
desigualdad derecha de la Ecuación (32), concluimos que si todos los 
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eigenvalores de A son negativos, entonces / tiene un máximo local en 0. 
Esto establece los incisos (a) y (b) del teorema. 

Ahora supóngase que A tiene un eigenvalor positivo y uno negativo, 
digamos Ài > 0 y À, < 0 para alguna i y alguna j. Entonces iA* — £ > 0 
y iA, ■+ £ < 0. Sea s cualquier número real tal que |j| < 8. Entonces, 
según la Ecuación (32), 

f(0) = 0 < (i\i ~ £ )^ 2 < f(sxi) y f(s Xj ) < (i\ ŷ + £ )s 2 < 0 = f(0). 

Puesto que ||5jfi|| = \\sxj\\ = |s|, concluimos que / alcanza valores posi- 
tivos y negativos arbitrariamente cercanos a cero. Por lo tanto, / no tiene 
ni un máximo local ni un mínimo local en cero. Esto demuestra el inci- 
so (c). 

Para ilustrar que la prueba de la segunda derivada no permite obtener 
ninguna conclusión bajo las condiciones establecidas en el inciso (d) del 
teorema, considérense las funciones 

f(t i, h) = t\- 4 y f(tu h) = t\ + t\ 
en p = 0. En ambos casos 



pero en el primer caso / no tiene un extremo local en 0 , mientras que 
en el último caso / tiene un mínimo local en 0. ■ 

EJERCICIOS 

1. Decir si las siguientes afirmaciones son verdaderas o falsas. 

(a) Toda forma cuadrática es una forma bilineal. 

(b) Si dos matrices son congruentes, tienen los mismos eigenvalores. 

(c) Las formas bilineales simétricas tienen representaciones matriciales 
simétricas. 

(d) Cualquier matriz simétrica es congruente con una matriz diagonal. 

(e) La suma de dos formas bilineales simétricas es una forma bilineal 
simétrica. 

(f) Dos matrices simétricas con el mismo polinomio característico son 
representaciones matriciales de la misma forma bilineal. 

(g) Existe una forma bilineal H tal que H(x, y) ^ 0 para toda x y 
toda y. 

(h) Si V es un espacio vectorial de dimensión n , entonces dim((B(V)) = 2 n. 

(i) Sea H una forma bilineal en un espacio vectorial dimensionalmente 
finito V. Para cualquier x £ V existe una y £ V tal que y^O pero 
H(x,y)= 0. 

(j) Si H es una forma bilineal cualquiera en un espacio real V dimen- 
sionalmente finito, con producto interior entonces existe una base /3 
para V tal que ýp(H) es una matriz diagonal. 
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2. Demostrar las propiedades 1, 2, 3 y 4 dadas en la p. 469. 

3. (a) Verificar que la suma de dos formas bilineales es una forma bilineal. 

(b) Verificar que el producto de un escalar por una forma bilineal es una 
forma bilineal. 

(c) Demostrar el Teorema 7.30. 

4. Determinar en cuál de los incisos siguientes se tienen formas bilineales. 

(a) Sea V = C[0, 1] el espacio de las funciones continuas de valor real 
en el intervalo cerrado [0, 1]. Para /, g€V, defínase 

H(f, g) = Cf(,t)g{t)dt. 

(b) Sea V un espacio vectorial sobre un campo F, y sea J e <B(V) no 
trivial. Defínase a H : V x V->F mediante 

H(x, y) = [J(x, y)Y para toda x,y£V. 

(c) Defínase a H: R x R -> R mediante H(t u t 2 ) = h + lt 2 . 

(d) Considérense los miembros de R 2 como vectores columnas. Definir a 

fj. para x, y € R 2 mediante H(x, y) = det(x, y), donde 

det(x, y) representa el determinante de la matriz de 2 x 2 con x 
como su primera columna y y como su segunda columna. 

(e) Sea V un espacio real con producto interior. Defínase a H: V x V 
-*R mediante H(x, y) = (x, y) para x, y€V. 

(f) Sea V un espacio complejo con producto interior. Defínase a H: 
V x V C mediante H(x, y) = (x, y) para x, yÇV. 


5. 


Verificar cjue cada uno de los mapeos dados es una forma bilineal. Luego 
calcular la representación matricial de H con respecto a la base dada. 

(a) H: R 3 x R 3 —donde 



(b) Sea V = M 2x ,(fî) con la base 



Defínase a H: V x V—> R mediante H(A, B) tv(A) tr(fi). 
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(c) Sea /? = {cos t, sen /, cos 2t, sen 2i) y V = L{j3). En el espacio de 
todas las funciones continuas en R, V es un espacio tetradimensional 
con una base /?. Defínase a H: V x V —> R mediante H(f, g ) = 
= f(0)-g"(0). 

6. Sean V y W espacios vectoriales sobre el mismo campo, y sea T: V-^W 

una transformación lineal. Para cualquier H e (B(W), defínase a T(//): 

VxV-*f mediante f (H) (x, y) = H(T(x), T(j)) para toda x, yÇV. 

Demostrar que 

(a) Para H e (B(W)>f(//) e (B(V). 

(b) T: (B(W) —► (B(V) es una transformación lineal. 

(c) Si T es un isomorfismo, f también lo es. 

7. En la demostración del Teorema 7.31 

(a) Demostrar que para cualquier base /3, ýp es Iineal. 

(b) Sea V un espacio vectorial n-dimensional sobre un campo F con una 
base /?, y sea <f>$: V —» F" la representación ordinaria de V con res- 
pecto a / 3 . Sea A €Mn xn (F). Defínase a H: VxV^F mediante 
H(x, y) = [^(x^YA^fy)]. Demostrar que H e (B(V). /,Se po- 
dría establecer esto como corolario al Ejercicio 6? 

8. (a) Demostrar el Corolario 1 del Teorema 7.31. 

(b) Para un espacio vectorial dimensionalmente finito V, describa un 
método para encontrar una base para (B(V). 

9. Demostrar el Corolario 2 del Teorema 7.31. 

10. Demostrar el Corolario 3 del Teorema 7.31. 

11. Demostrar que la relación de congruencia es una relación de equivalencia. 

12. La siguiente descripción nos proporciona una demostración altemativa para 

el Teorema 7.32. 

(a) Si /3 y y son bases para un espacio vectorial dimensionalmente finito 
V, y si Q es la matriz de cambio de coordenadas, demostrar que 
^■(3 = Lq4‘ 7 , donde y <f> y son las representaciones ordinarias de V 
con respecto a p y y, respectivamente. 

(b) Aplicar el Corolario 2 del Teorema 7.31 al inciso (a) para obtener 
una demostración alternativa del Teorema 7.32. 

13. Sea V un espacio vectorial dimensionalmente finito y H e (B(V). Demos- 

trar que, para bases cualesquiera /3 y y de V, rango (>pp(H)) = rango (f y (H)). 
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14. Demostrar las proposiciones siguientes. 

(a) Cualquier matriz cuadrada diagonal es simétrica. 

(b) Cualquier matriz congruente con una matriz diagonal es simétrica. 

(c) Demostrar el corolario del Teorema 7.34. 

15. Sea V un espacio vectorial sobre un campo F cuya característica no sea 
dos, y sea H una forma bilineal simétrica en V. Demostrar que si K(x) = 
= H(x, x) es la forma cuadrática asociada con H, entonces 

H(x, y) = i[K(x + y) ~ K(x) - K(y )] 

para toda x, y £ V. 

16. Para las siguientes formas cuadráticas K sobre un espacio real con pro- 
ducto interior V, encontrar una forma bilineal simétrica H tal que K(x) = 
= H(x, x) para toda x£V. Después, encontrar una base /3 ortonormal para 
V tal que i//p(H) sea una matriz diagonal. 

(a) K: R 2 => R definida mediante 

K ^ ^ ~ —2/i + 4 tito + t-2 

(b) K: R 2 => R definida mediante 

K Ç 1 ) = 7/7 - 8/i4 + íl 

(c) K: R 3 => R definida mediante 

= 3 1\ + 3/| + 3íf - 2/,í 3 

17. Sea S el conjunto de todos los 



tales que 

3 1\ + 3 1\ + 3 1\ - 2UU + 2V2(U + / 3 ) + 1 = 0. 

Encontrar una base ortonormal /3 para R 3 tal que se simplifique la ecua- 
ción que relaciona las coordenadas de los puntos de § relativas a (3. 
Describir geométricamente a §. 

18. Demostrar la siguiente expresión más refinada del inciso (d) del Teore- 
ma 7.36. 
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(a) Si 0 < rango(/4) < n y A tiene eigenvalores no negativos, entonces 
/ no tiene un mínimo local en p. 

(b) Si 0 < rango(/l) < n y A tiene eigenvalores no positivos, entonces 
/ no tiene un máximo local en p. 


19. Demostrar la siguiente variación de la prueba de la segunda derivada para 
el caso en que wi= 2. Defínase a 


(a) 

(b) 

(c) 

(d) 


P 2 /(P) 1 

f3 2 /(p)l 

f d 2 f(p) 1 

L(aí.)' J J 

L(^) 2 J 

L(3í.)(3<2)_ 


Si D > 0 y d 2 f(p)/(dt i) 2 > 0, entonces / tiene un mínimo local en p. 
Si D > 0 y d 2 f(p) / (0í 2 ) 2 < 0, entonces / tiene un máximo local en p. 
Si D < 0, entonces / no tiene un extremo local en p. 

Si D = 0, entonces no se puede obtener conclusión alguna. 


Sugerencia: Obsérvese que D - det(A) •= donde y À 2 son los 
eigenvalores de A, y A es como en el Teorema 7.36. 


20. Sea A una matriz de n x n sobre un campo F, y sea E una matriz ele- 
mental de n x n sobre F. En la Sección 3.1 se demostró que AE puede 
obtenerse a partir de A mediante una operación elemental con columnas. 
Demostrar que E f A puede obtenerse a partir de A mediante la misma 
operacion elemental, pero realizada sobre los renglones y no sobre las 
columnas de A. Sugerencia: Nótese que E l A — (A^E)*. 

21. Para cada una de las siguientes matrices A con elementos del campo de 
los números racionales, encontrar una matriz diagonal D y una matriz 
invertible Q tal que Q l AQ = D. 



Sugerencia: Utilizar una operación elemental distinta de la de intercam- 
biar columnas. 

(c) /3 1 2\ 

^=14 0 

\2 0 -l/ 
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APENDICE A CONJUNTOS 

Un conjunto es una colección de objetos, llamados elementos del conjunto. 
Si x es un elemento del conjunto A , escribimos x Ç_A\ si x no es elemento 
de A, escribimos x0A. Por ejemplo, si Z es el conjunto de los enteros, 
entonces 3 £Z y igZ. 

Se dice que dos conjuntos A y B son iguales , lo que se escribe como 
A — B, si contienen exactamente los mismos elementos. Los conjuntos se 
pueden describir de dos maneras: 

1. Enlistando todos los elementos del conjunto entre llaves { }. 

2. Describiendo los elementos del conjunto en términos de alguna 
propiedad característica. 

Por ejemplo, el conjunto que consta de los elementos 1, 2, 3 y 4 se puede 
escribir como {1, 2, 3, 4} o como 

{x: x es un entero positivo menor que 5). 

Nótese que el orden en el que se enumeran los elementos es intrascendente; 
por lo tanto 

{1,2, 3,4} - {3,1,2, 4} - {1,3, 1,4,2}. 

Ejemplo 1. Sea A el conjunto de números reales comprendidos entre 
1 y 2. Entonces, A puede escribirse como 

A = {x: x es un número real y 1 < x < 2} 

o bien, si R es el conjunto de los números reales, como 

A = {x£R: ì <x <2}. 

Se dice que un conjunto B es subconjunto de un conjunto A, lo que 
se escribe B Ç A o A D B, si todo elemento de B es un elemento de A. 
Por ejemplo, {1, 2, 6} C {2, 8, 7, 6, 1}. Obsérvese que A — B si y sólo 
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si/4 Q B y B Q A, un hecho que se utiliza frecuentemente para demostrar 
que dos conjuntos son iguales. 

E1 conjunto vacío, denotado por 0, es el conjunto que no contiene 
ningún elemento. E1 conjunto vacío es un subconjunto de todo conjunto. 

Los conjuntos pueden combinarse para formar otros conjuntos de dos 
maneras básicas. La unián de dos conjuntos A y B, que se escribe 
A U B, es el conjunto de los elementos que están en A, o en B, o en 
ambos; esto es, 


/4 U fí — {x: xÇ_A o xdB). 

La intersección de dos conjuntos A y B, que se escribe A n B, es el 
conjunto de los elementos que están en A y en B; esto es, 

A D B ~ {x: x £A y x £B}. 

Dos conjuntos se llaman disjuntos si su intersección es el conjunto vacío. 

Ejemplo 2. Sea A - {1, 3, 5} y B = {1, 5, 7, 8}. Entonces 
A U B = {1, 3, 5, 7, 8} y A n B = {1, 5}. 

De manera semejante, si X ~ {1, 2, 8} y Y = {3, 4, 5}, entonces 
X U Y - {1, 2, 3, 4, 5, 8} y X n F = 0. 

Por lo tanto, X y Y son conjuntos disjuntos. 


La unión y la intersección de más de dos conjuntos puede definirse 
de una manera análoga. Espedficamente, si A u A 2 , ... , A n son conjuntos, 
entonces la unión y la interseceión de estos conjuntos se define como 

n 

LJ A, = {*: x£ A, para alguna / = 1, 2, . . . «} 

y 

n 

O A i = {*'■ x£A ■, para toda / — 1, 2.n}. 

De una manera semejante, si A es un conjunto de índices y {A a : «ÇA) 
es ima colección de conjuntos, la unión y la intersección de estos conjun- 
tos se definen como 


y 


U a — {*: x Ç A a para alguna « £ A} 


0 {-ï: x£ A„ para toda «6 A}. 
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Ejemplo 3. Sea A = {a £R: a > 1} y sea 

^-<JC<1+«| 

para toda « £ A, donde R es el conjunto de números reales. Entonces 
U^« = {*eJ?: x > —1} y fj = {jc e R: 0<x<2}. 

«€A ot€A 

Por relación en un conjunto A queremos decir que se trata de una 
regla para determinar, para elementos arbitrarios x e y de A, si x se 
encuentra o no relacionada con y. Más precisamente, una relación en A 
es un conjunto S de pares ordenados de elementos de A tales que 
( x , y) Ç_S si y sólo si x tiene algún parentesco dado con y. Por ejemplo, 
en él conjunto de números reales, u es igual a”, “es menor que” y “es 
mayor que o igual a” son relaciones comunes. Una relación S en un con- 
junto A se llama relación de equivalencia en A si se cumplen las tres 
condiciones siguientes: 

1. Para toda x£A, (x, x) £S (reflexividad). 

2. Si ( x, y) ÇS, entonces (y, x) ÇS (simetría). 

3. Si (x, y) £S y (y, z) ÇS, entonces (x, z) Ç.S (transitividad). 

Si S es una relación de equivalencia en un conjunto A, escribiremos co- 
múnmente x ^ y en lugar de (jc, y) ÇS. Por ejemplo, si definimos x ^ y 
para indicar que x — y es divisible entre un entero fijo n, entonces es 
una relación de equivalentia en el conjunto de los enteros. 


APENDICE B FUNCIONES 

Si A y B son conjuntos, entonces una función f de A en B, que puede 
escribirse como /: A B, e s una regla que asocia a cada elemento de 
x en A un elemento único llamado f(x) en B. E1 elemento f(x) se llama 
imagen de x (bajo f) y x se llama preimagen de f(x) (bajo f). Si /: 
A ->B, entonces A se llama dominio de /, y el conjunto { f(x): xÇ A} 
de todas las imágenes de los elementos de A se llama rango de /. Nótese 
que el rango de / es un subconjunto de B. Si S C A, denotaremos por 
f(S) al conjunto [f(x): xÇS) de todas las imágenes de los elementos 
de S. De la misma forma, si T C B, denotaremos por f~ x (T) al conjunto 
{xÇA: f(x) ÇT) de todas las preimágenes de los elementos de T. 
Finalmente, dos funciones /: A B y g: A B son iguales si f(x) = 
— g(x) para toda xÇA. 

Ejemplo 1. Supóngase que A — [—10, 10] y B = R, el conjunto de los 
números reales. Sea /: A -> B la función que asigna a cada elemento x 
en A el elemento x 2 -í- 1 en B; esto es, / está definida mediante f(x) = 
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= x 2 + 1. Entonces, A es el dominio de / y [1, 101] es el rango de /. 
Como /(2) = 5, la imagen de 2 es 5 y 2 es una preimagen de 5. Nótese 
que —2 es otra preimagen de 5. Más aún, si S = [1, 2] y T = [82, 101], 
entonces f(S) = [2, 5] y /^(T) = [-10, -9] U [9, 10]. 

Tal como lo muestra el ejemplo anterior, la preimagen de un elemento 
del rango no necesariamente es única. Las funciones tales que cada ele- 
mento del rango tiene una preimagen única se llama uno-a-uno\ es decir, 
/: A => B es uno-a-uno si f(x) = f(y) implica que x = y o, de un 
modo equivalente, si x=£y implica que f(x) ^f(y). 

Si /: A > B es una función de rango B, o sea, si f(A) = B , entonces 
/ se llama sobreyectiva . 

Supóngase que /: A => B es una función y S C A. Entonces puede 
formarse una función f s : S -» que se denomina restricción de f a S. 
definiendo / s (jr) = /(jc) para cada 

E1 ejemplo siguiente ilustra estos conceptos. 

Ejemplo 2. Sea /: [— 1, 1] —> [0, 1] definida mediante f(x) = x 2 . Esta 
función es sobreyectiva pero no uno-a-uno ya que /( — 1) =/(1) = 1. 
Nótese que si S = [0, 1], entonces f s es sobreyectiva y uno-a-uno. Por últi- 
mo, si T = [i, 1], entonces f T es uno-a-uno, pero no sobreyeotiva. 

Sean A, B y C conjuntos y /: A =>B y g: B C funciones, Apli- 
cando / seguida de g obtenemos una función g°f: A llamada la 

función compuesta de g y /. Entonces, (gof)(x) = g(f(x)) para toda 
xÇ,A. Por ejemplo, sean A ~ B ~ C — R (el conjunto de los números 
reales), f(x) = senxy g(jc) = x 2 + 3. Entonces, (g°f)(x) = g(f(x)) = 
— sen 2 * + 3, mientras que (f°g)(x) = f(g(x)) sen = (jc 2 + 3). Por lo 
tanto, g o f ^zf o g. Sin embargo, la composición funcional es asociativa; 
esto es, si h: C -> D, entonces h o (g o /) — (/i o g) o /. 

Se dice que una función f: A —> B es invertible si existe una función 
g: B => A tal que (/ o g) (y) = y para toda y £ J5 y (# o /) (x) = jc para 
toda x£A. Si tal función g existe, entonces es única y se llama la inversa 
de /. Escribiremos la inversa de / (cuando exista) como f 1 . Puede demos- 
trarse que / es invertible si y sólo si / es sobreyectiva y uno-a-uno. 

Ejemplo 3. La función /: R -> R definida mediante f(x) = 3x + 1 es 
uno-a-uno y sobreyectiva; por lo tanto, es invertible. La inversa de / es la 
función f- 1 : R^R definida mediante f~ x (x) = (x — l)/3. 

Los siguientes hechos acerca de las funciones invertibles pueden de- 
mostrarse fácilmente: 

1. Si /: A -» B es invertible, entonces / 1 es invertible y (/ _1 ) _1 ~ /• 

2. Si /: A^>Byg: B => C son invertibles, entonces gofts inver- 
tible y (gof)~ l = f 1 o g-\ 
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APENDICE C CAMPOS 

E1 conjunto de números reales es un ejemplo de una estructura algebraica 
llamada “campo”. Básicamente, un campo es un conjunto en el cual se 
pueden definir cuatro operaciones (llamadas adición, multiplicación, subs- 
tracción y división) tales que, con excepción de la división entre cero, 
la suma, el producto, la diferencia y el cociente de cualquier par de ele- 
mentos del conjunto, es un elemento del conjunto. Más detalladamente, 
un campo se define de la siguiente manera. 

Definiciones. Un campo F es un conjunto en el cual se definen dos operaciones 
+ y ■ (llamadas, respectivamente, adición y multiplicación) de modo que 
para cualquier par de eiementos a, b en F existen elementos únicos a + b 
y a • b en F taies que se cumpien las siguientes condiciones para todos ios 
eiementos a, b, c en F. 

(F 1) a + b~b + a y a • b = b • a 

(conmutatividad de la adición y ia multipiicacián). 

(F 2) (a + b) + c = a + (b + c) y (a • b) • c = a • (b • c) 
(asociatividad de ia adición y ia multipiicación). 

(F 3) Existen eiementos distintos 0 y 1 en F taies que 

0 + a = a y 1 • a = a 

(existencia de eiementos identidad para ia adición y îa mul- 
tiplicación). 

(F 4) Para cada elemento a en F y cada elemento no nulo b en F 
existen eiementos c y d en F tales que 

a + c = 0 y b • d = 1 

(existencia de inversos para la adición y la multiplicación). 
(F 5) a • (b + c) = a * b + a • c 

(distributividad de ia multiplicación sobre la adición). 

Los eiementos a + b y a • b se llaman, respectivamente, suma y producto 
de a y b. Los elementos 0 (léase “cero”) v 1 (léase “uno”) mencionados 
en (F 3) se Uaman elementos de identidad para la adición y ia multipli- 
cación, respectivamente, y ios elementos c y d citados en (F 4) se deno- 
minan, respectivamente, inverso aditivo para a e inverso multiplicativo 
para b. 

Ejemplo 1. E1 conjunto de números reales con las definiciones ordinarias 
de adición y multiplicación es un campo que se denotará por R. 

Ejemplo 2. E1 conjunto de los números racionales con las definiciones 
ordinarias de adición y multiplicación es un campo. 
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Ejemplo 3. E1 conjunto de todos los números reales de la forma a + 

+ ò V 2, donde a y b son números racionales, con la adición y la multi- 
plicación como en R , es un campo. 

Ejemplo 4. E1 campo Z 2 consta de dos elementos 0 y 1 con las opera- 
ciones de adición y multiplicación definidas por las ecuaciones 

0 + 0 — 0 , 0 + 1 = 1 + 0 = 1 , 1 + 1 = 0 , 

00=0, 01 = 10 = 0, y 11=1. 

Ejemplo 5. Ni el conjunto de los enteros positivos ni el de los enteros 
con las definiciones ordinarias de adición y multiplicación es un campo, 
puesto que en ambos (F 4) no se satisface. 

Los elementos de un campo cuya existencia queda garantizada por 
(F 3) y (F 4) son únicos; esto es consecuencia del teorema siguiente. 

Teorema C,l. (Leyes de caneelación.) Sean a, b y c elemeníos cualesquiera de 
un campo F. 

(a) Si a + b = c + b, entonces a = c. 

(b) Si a • b = c • b y b += 0, enlonces a = c. 

demostración. Las demostraciones de (a) y (b) son semejantes, por 
lo que únicamente se demostrará (b). 

Si b =+ 0, entonces (F 4) garantiza la existencia de un elemento d 
en F tal que b • d = 1. Multiplíquense ambos lados de la igualdad a - b = 
= c 'b por d para obtener (a • b) • d = (c • b) • d. Considérese el lado iz- 
quierdo de la igualdad: en virtud de (F 2) y (F 3) tenemos 

(a - b) d = a ’ (b ' d) = a * 1 = a. 

De igual manera, el miembro derecho de la igualdad se reduce a c. En- 
tonces 


a= (a - b) • d = (c' b) • d c. ■ 

Corolario. Los elementos 0 y 1 mencionados en (F 3) y los elementos c y d 
mencionados en (F 4) son únicos. 

DEMOSTRACiÓN. Supóngase que 0' satisface que 0' + a = a para cada 
a£F. Como 0 + a = a para cada a£F, tenemos que 0' + a = 0 + a 
para cada aÇ_F. Por tanto, por el Teorema C.l, 0' = 0. 

La demostración de las partes restantes es similar. ■ 


Así, cada elemento b en un campo tiene un inverso aditivo único y, 
si b 0, también un inverso multiplicativo único. (Se demostrará en el 
corolario del Teorema C.2 que 0 no tiene un inverso multiplicativo.) 
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E1 inverso aditivo y el inverso multiplicativo de b se escdben —b y ír\ 
respectivamente. Nótese que —( — b) ~ b y (b' 1 )- 1 = b. 

La substracción y la división se pueden definir en términos de la 
adición y la multiplicación utilizando los inversos aditivo y multiplicativo. 
Específicamente, la substracción de b se define como la adición de —b 
y la división entre b 7 ^ 0 se define como la multiplicación por b 1 ; esto es, 

a ~ b = a + (~b) y a/b — a b \ 

La division entre cero es indefinida, pero, con esta excepción, la suma, 
el producto, la diferencia y el cociente están definidos para cualquier par 
de elementos de un campo. 

Muchas de las propiedades ordinarias de la multiplicación de números 
reales son ciertas en cualquier campo, como lo demuestra el teorema si- 
guiente. 

Teorema C.2. Sean a y b elemeníos cualesquiera de un campo. Enîonces es 
cierto cada uno de ìos incisos siguientes. 

(a) a * 0 = 0 

(b) (-a)b-a(-b) - — (a • b) 

(c) ( —a) • (-b) = a-b 

DEMOSTRACIÓN. 

(a) Como 0 + 0 = 0, (F 5) muestra que 

a-0 = a- (0 + 0) = a O + a- 0. 

Luego, 0 + a 0 = a 0 + a 0, y eliminando a • 0 por el Teorema C.l 
se tiene 0 = a 0 . 

(b) Por definición — (a ■ b) es el único elemento de F tal que a • b + 

+ [— (a • fc)] = 0. Entonces, con objeto de demostrar que (— a) • b = — 

— (a b) es suficiente con mostrar que a b + (—a)*è = 0. Pero — a 
es el elemento de F tal que a + ( — a) = 0, y entonces 

a - b + (~a) ' b = [a + (~a)] - b = 0 - b = b - 0 = 0 

por (F 5) y el inciso (a). Así, (-a) ■ b = - (a • b). La demostración de 

que a' (~b) = —(a b) es similar. 

(c) Aplicando dos veces el inciso (b), tenemos que 

(~a) • (~b) = -[a' (- b )] = [-(a b)] = a b. ■ 

Corolario. La identidad aditiva de un campo no tiene inverso multipîicativo. 

En un campo cualquiera F, puede suceder que una suma 1 + 1 + ... 

. . . + 1 (p sumandos) sea igual a cero para algún entero positivo p. 
Por ejemplo, en el campo Z L . (definido en el Ejemplo 4), 1 + 1 = 0. 
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En este caso el entero positivo más pequeno posible p para el cual una 
suma de p l’s es igual a cero, se llama característica de F; si no existe 
tal entero positivo, se dice que F tiene característica cero. Así pues, Z 2 
tiene característica dos, y R tiene característica cero. Obsérvese que si 
F es un campo de característica p 0, entonces x -f x + . . . + x (p 
sumandos) es igual a 0 para toda x£F. En un campo de característica 
finita (especialmente de característica dos) surgen muchos problemas no 
usuales. Por esta razón, algunos de los resultados sobre espacios vecto- 
riales enunciados en este libro requieren que el campo sobre el que se 
defina el espacio vectorial sea de característica cero (o, al menos, de 
alguna característica diferente de dos). 

Finalmente, nótese que en otras secciones de este libro, el producto 
de dos elementos a y b de un campo se expresa ab en vez de a • b. 


APENDICE D NUMEROS COMPLEJOS 

Para los propósitos del álgebra, el campo de los números reales no es 
suficiente, puesto que existen polinomios de grado no nulo con coeficien- 
tes reales que no tienen ceros en el campo de los números reales (por 
ejemplo, x 2 + 1). Es pues a menudo deseable tener un campo en el 
que cualquier polinomio de grado no nulo con coeficientes de dicho campo 
tenga un cero en éste. Por esta razón “agrandaremos” el campo de los 
números reales para obtener tal campo. 

Definiciones. Un número complejo es una expresión de la forma z — a + bi, 
donde a y b son números reales llamados, respectivamente , parte real y 
parte imaginaria de z. 

La suma y el producto de dos números compíejos z=a + biyw~ 
= c + di (donde a, b, c y d son números reales) se definen de la siguiente 
ìnanera: 


z + w = (a + bi) + (c + di) = (a + c) + (b + d)i 

y 

zw — (a + bi) (c + di) — (ac — bd) + (bc + ad)i. 

Ejemplo 1. La suma y el producto de z = 3 — 5/ y w = 9 + 7/ son 
z w = (3 - 5i) + (9 + li) = (3 + 9) + [(-5) + 7]/ = 12 + 2/ 

y 

- (3 - 5/)(9 + 7/) - [3 - 9 - (-5) -7] + [(-5) -9 + 3 7]/ 


= 62 - 24/. 
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Cualquier número real c puede ser considerado como un número com- 
plejo asociando a c con el complejo c + 0 i. Obsérvese que esta corres- 
pondencia conserva las sumas y los productos; es decir, 

(c + 0/) + (d + Oí') = (c + d) + 0/, y (c + 0/) ( d + 0 f) = cd + 0/. 

Cualquier número complejo de la forma bi = 0 + bi, donde b es un 
número real no nulo, se llama imaginario. E1 producto de dos números 
imaginarios es real puesto que 

(bi) (di) = (0 + bi) (0 + di) = (0 — bd) + (f> • 0 + 0 • d)i 
= -bd. 

En particular, para i = 0 + 1/, tenemos que i • i = — 1. 

La observación de que i- = i i= -1 proporciona una manera fácil 
de recordar la definición de multiplicación de números complejos: senci- 
llamente multiplíquense dos números complejos como se multiplicarian 
dos expresiones algebraicas y sustitúyase i 2 por -1. E1 Ejemplo 2 dus- 
tra esta técnica. 

Ejemplo 2. E1 producto de — 5 + 2i y 1 — 3i es 

(-5 + 2i)(1 - 3i) = -5(1 - 3i) + 2i(l - 3i) 

= -5 + 15i + 2i - 6i 2 
= -5 + 15i + 2i - 6( — 1) 

= 1 + 17i. 

E1 número real 0, considerado como un número complejo, es un ele- 
mento identidad aditivo para el conjunto de números complejos, puesto 
que 

(a + bi) + 0 = (a + bi) + (0 + Oi) = (a + 0) + (b + 0)i 
bi. 

De una manera análoga, el número real 1, considerado como un número 
complejo, es un elemento identidad multiplicativo para el conjunto de los 
números complejos, pues 

(a + bi) ■ 1 = (a + bi)(l + 0 i) = (a ■ 1 - b- 0 ) + (b ■ 1 - «• 0)* 

= a + bi. 

Es evidente que todo número complejo a + bi tiene un inverso aditivo, 
que es (-a) + (-b)i. Pero también todo número complejo, con excep- 
ción del 0, tiene un inverso multiplicativo. De hecho, 

(a + fci)- = (^4-ŷ) ~ 

En vista de los enunciados anteriores no debe sorprendemos el resul- 
tado siguiente. 
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Teorema D.l. El conjunío de números complejos con las operaciones de adi- 
ción y multiplicación definidas anteriormente es un campo. 

E1 campo de los números complejos será representado por C. 

Definición. El (complejo) conjugado de un número complejo a + bi es el nú- 
mero compîejo a — bi. Escribiremos el conjugado deî número complejo z 
como z. 

Ejemplo 3. Los conjugados de -3 + 2/, 4 - li y 6 son los siguientes: 
3 + 2 í 3 2/, 4 7/ “ 4 + 7/, 

y _ _ 

6 = 6 + 0 / = 6 — 0 / = 6 . 

E1 siguiente resultado es una consecuencia inmediata de la definición 
de complejos conjugados. 

Teorema D.2. Un mímero complejo z es im número real si y sólo si z = I. 

Para cualquier número complejo z = a + bi, z2 es real y no nega- 
tivo, ya que 

zz = (a + bi ) (a — W) = a 2 + b 2 . 

Este hecho puede utilizarse para definir el valor absoluto de un número 
complejo. 

Definición. El valor absoluto (o módulo) de un número complejo z = a + bi 

e/ número real V a 2 + b 2 . Escribiremos el vaïor absoluto de z como |zj. 
Obsérvese que zz — |z| 2 . 

El hecho de que el producto de un número complejo por su conju- 
gado sea real proporciona un método sencillo para determinar el cociente 
de dos números complejos, ya que si c + di ^ 0 , entonces 

a + bi _ a + bi c — di (ac + bd) + (bc — ad)i 

c + di c + di c — di c 2 + d ~ 

_ ac + bd ( bc — ad 

~ ~c ] + d- + C 2 + d 2 l ' 

Ejemplo 4. Ilustraremos el procedimiento descrito anteriormente calcu- 
lando el cociente (1 + 4/)/(3- 2 /): 

1 + 4í _ 1 + 4/ 3 + 2/ _ -5 + 14/ 5 14. 

3-2/ 3 - 2/ ' 3 + 2/ _ ~9~+4~ ~ ~n + n L 

E 1 valor absoluto de un numero complejo tiene las propiedades ordi- 
narias del valor absoluto de un numero real, tal como lo muestra el 
siguiente resultado. 
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Teorema D.3. Sean z y w dos números complejos cualesquiera. Entonces 

(a) |z + w| < |z| + |w|. 

(b) |zw| — |z| • |w|. 

(c) |z| — |w| < \z + w|. 

demostración. Sean z = a + bi ŷ w + c + di, donde a, b, c y d son 
números reales. 

(a) Obsérvese primero que 

0 < (ad — bc ) 2 — a~d 2 — labcd + b 2 c 2 , 

entonces labcd < à-d 2 + b 2 c 2 . Sumando a-c 2 + b 2 (P a ambos lados de 
la desigualdad se tendrá que 

(ac + bd) 2 = « 2 c- + 2abcd + 

< à 2 c 2 + a 2 d 2 + b 2 c 2 + b 2 d 2 = (a 2 + b 2 )(c 2 + d 2 ). 

Tomando las raíces cuadradas, tenemos 

ac + bd < V à 1 + b 2 V c 2 + d 2 . 

Ahora bien, 

| z + w\ 2 = |(a + c) + (b + d )/| 2 
= (a + c) 2 + (b + d) 2 
— a 2 + c 2 + b 2 + d 2 + 2 (ac + bd) 

< a 2 + c 2 + b 2 + d 2 + 2 \V + fr 2 V c 2 + 

= (Va 2 + b 2 + V c 2 + d 2 ) 2 
= (|zj + |*v|) 2 . 

Tomando las raíces cuadradas, obtenemos (a). 

(b) A partir de la definición de valor absoluto vemos que 

\zw\ = \(a + 6 /)(c + dï)| — |(ac — bd) + (bc + ad)i\ 

= V (ac - bd) 2 + (bc + oû ?) 2 = V« 2 c 2 + b 2 d 2 + b 2 c 2 + a 2 (P 

= Vff 2 + b 2 Vc 2 + d 2 = |a + bi\ * |c + rff[ = |z| • [w|. 

(c) Partiendo de (a) y (b) se tiene que 

\z\ = \(z + w) — w\ < \z + w\ + | — w| = \z + w| + |w|. 

Entonces 

\z\ - |w| < \z + w|. ■ 

Nuestra motivación para agrandar el conjunto de números reaîes al 
conjunto de números complejos fue Ia de obtener un campo tal que cada 
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polinomio de grado no nulo con coeficientes de ese campo tenga un cero. 
Nuestro siguiente resultado garantiza que el campo de números comple- 
jos tiene esta propiedad. 

Teorema D.4. (Teorema fundamental del álgebra.) Sean a 0 , . . . , a u (n > 1 ) 
números complejos tales que a n 0 . Entonces 

a n z n + a^z 11 ' 1 + ... + a,z + a 0 
tiene un cero en el campo de los números complejos. 

Para la demostración consúltese: Principies of Mathematical Analysis , 
de Walter Rudin; McGraw-Hill Book Company, 1964. 

E1 siguiente importante corolario se deriva del Teorema D.4 y del 
algoritmo de la división para polinomios (Teorema E.l). 

Corofarîo. Si p(z) = a n z n + . . . + a^z + a 0 es un polinomio de grado n > 1 
con coeficientes complejos, entonces existen números complejos c u . . . , 
c n (no necesariamente distintos) tales que 

p(z) = a n (z - c.). . . (z - c n ). 

Un campo se llama algebraicamente cerrado si tiene la propiedad de 
que todo polinomio con coeficientes de ese campo se descompone en un 
producto de factores de grado 1. Por lo tanto, el corolario anterior demues- 
tra que el campo de números complejos es algebraicamente cerrado. 


APENDICE E POUNOMIOS 

En este Apéndice expondremos algunas propiedades básicas de los poli- 
nomios necesarias para los Capítulos 5 y 6. Para la definición de polino- 
mios, véase la Sección 1.2. 

Definición. Un polinomio f(x) divide a un polinomio g(x) si existe un polino- 
mio q(x) tal que g(x) = f(x)q(x). 

Nuestro primer resultado ensena que el largo proceso ordinario de 
división para polinomios con coeficientes reales es válido para polinomios 
con coeficientes de un campo cualquiera. 

Teorema E.l. {Algoritmo de la división para poîinomios.) Sea ^(x) un polino- 
mio de grado n, y sea f 2 (x) un polinomio de grada m > 0. Entonces, 
existen polinomios q(x) y r(x) tales que 

(a) El grado de r(x) es menor que m. 

(b) fi(x) = q(x)f 2 (x) + r(x). 

(c) q(x) y r(x) son únicos con respecto a las condiciones (a) y 
(b). 
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demostración. Principiaremos estableciendo la existencia de q(x) y 
r(x) que satisfarán las condiciones (a) y (b). Si n < m, podemos to- 
mar q(x) = 0 y r(x) = /i(jc) que satisfacen (a) y (b). 

Supóngase, por tanto, que m < n. En este caso estableceremos la exis- 
tencia de q(x) y r(x) por inducción sobre n. Supóngase primero que 
n = 0 ; entonces m < n implica que m — 0 , de manera que fi(x) y f 2 (x) 
son constantes no nulas. Por lo tanto, podemos tomar a q(x) — fi(x) 
(x)f^(x) y r(x) = 0 para satisfacer a (a) y (b). 

Ahora supongamos que el teorema es cierto siempre que fi(x) tenga 
un grado menor que n > 0. Sea 

fi(x) = a n x 11 + a n - iX n_1 -f . . . + a Y x + a 0 

y 

f 2 (x) = b m x m + bm-iX m ~ 1 + ... + bjX + b 0 , 
donde m < n. Defínase un polinomio h(x) mediante 


h(x) = fi(x) - a n b^x n ' m f 2 (x) ( 1 ) 

— (a — ab 'b )x n_1 + (a ~ a b~'b )x n ~~ 

v n-i n m m-i' v n-2 n m m -2 ' 

+ . .. + (a - a b-'bj. 

v 0 n m 0 / 

Entonces h(x) es un polinomio de grado menor que n. Consideraremos 
dos casos. 


Caso 1. h(x ) es de grado menor que m. En este caso, sea q(x) — 
= ajb-jx n ~ m y r(x ) = h(x). Entonces, de la Ecuación (1) se tiene 

íi(x) = q(x)f-.(x) + r(x). 


y r(x) tiene grado menor que m. 

Caso 2. h(x) es de grado mayor o igual que m. Como h(x) tiene grado 
menor que n, podemos aplicar la hipótesis de inducción para obtener 
polinomios q x (x) y r(x) tales que r(x) es de grado menor que m y 

h(x) = q t (x)f,(x) + r(x). (2) 

Combinando las Ecuaciones (1) y (2) y resolviendo para f,(x), tenemos 

fi(x) = + qÁx)]f,(x) + r(x). 

En este caso sea q(x) = a n b~ n ' i x n - m + qjx), de manera que f t (x) — q 
q(x)f,(x) + r(x), donde r(x) tiene grado menor que m. Esto demuestra 
la existencia de q(x) y r(x). \ 

Demostraremos ahora la unicidad de q y r. Supóngase que q,(x), 
q,(x), rjx) y r 2 (x) existen de modo que r,(x) y r 2 (x) tienen ambos un 
grado menor que m y 

fjx) = qjx^fjx) + rjx) = q 2 (x)f,(x) + r 2 (x). 
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Entonces 


[<?.(•*) - q*(x)]f,(x) = r 2 (x) - ri (x). ( 3 ) 

E 1 lado derecho de la Ecuación (3) es un polinomio de grado menor que 
m. Como f 2 (x) tiene grado m, debemos tener que q x (x) — q 2 (x) es el 
polinomio cero. Por lo tanto, q,(x) = q 2 (x), y por la Ecuación ( 3 ) 
r,(x) = r,(x). ■ 


Dentro del contexto del Teorema E.l, llamamos a q(x) y a r(x), 
respectivamente, cociente y residuo de la división de /, (x) entre f 2 (x). 
Por ejemplo, el cociente y el residuo de la división del polinomio com- 
plejo 

fi(x) = (3 + /)x 5 - (1 - i)x 4 + 6x J + (-6 + 2i)x- + (2 + i)x + 1 
entre el polinomio complejo 

fAx) = (3 + i)x- — 2 ix + 4 
son 


q(x) - x 3 + ix- - 2 y r(x) = (2 - 3 i)x + 9 . 

Corolario 1. Sea î(x) un polinomio cuyo grado es al menos 1 , y sea aÇF. 
Entonces f(a) = 0 si y sólo si x - a divide a f(x). 

demostración. Supóngase que x — a divide a f(x). Entonces, existe 
un polinomio q(x) tal que f(x) = (x - a)q(x), por Io que f(a) = (a - 
- a)q(a) = O q(a) = 0. 

Recíprocamente, supóngase que f(a) = 0 . Por el Teorema E.l existen 
polinomios q(x) y r(x) tales que r(x) tiene grado menor que uno y 

f(x) = q(x)(x - a) + r(x). 

Sustituyendo a por x en la expresión anterior obtenemos r(a) = 0. Como 
r(x) tiene grado menor que 1 , debe ser el polinomio constante r(x) = 0. 
Luego, f(x) = q(x)(x - a). ■ 

Para cualquier polinomio f(x) con coeficientes de un campo F, un 
elemento aÇ_ F se llama cero de f(x) si f(a) = 0. Con esta terminología, 
el corolario anterior establece que a es un cero de f(x) si y sólo si x — a 
divide a f(x). 

Corolario 2. Cualquier polinomio de grado n > 1 tiene como máximo n ceros 
distintos. 

demostración. La demostración se hará por inducción sobre n. E1 re- 
sultado es evidente si n = 1 . Supóngase entonces que el resultado es cierto 
para algún entero positivo n, y sea f(x) un polinomio de grado n + 1 . 
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Si f(x) no tiene ceros, no hay nada que demostrar. Por otra parte, si a 
es un cero de f(x), por el Corolario 1 podemos escribir f(x) = (x — 

- a)q(x) para algún polinomio q(x). Nótese que q(x) debe ser de gra- 
do n; por lo tanto, por la hipótesis de inducción, q(x) puede tener a lo 
más n ceros diferentes. Entonces, como cualquier cero de f(x) diferente 
de a es también un cero de q(x), f(x) puede tener como máximo n + 1 
ceros diferentes. ■ 

En el estudio de las formas canónicas surgen de manera natural poli- 
nomios que no tienen divisores comunes. 

Definición. Sean f(x) y g(x) polinomios, ambos de grado inayor que cero. 
Se dice que estos polinomios son primos relativos si no existe ningún poli- 
nomio de grado positivo que los divida a ambos. 

Por ejemplo, los polinomios f(x) = x-(x - 1 ) y h(x) - (x - 1 ) (x - 

— 2 ) (x — 1) (x — 2 ) no son primos relativos, puesto que x — 1 divide 
a f(x) y a h(x). Los polinomios f(x) y g(x) = (x - 2)(x - 3) son 
primos relativos, puesto que no tienen factores comunes de grado positivo. 

E1 teorema siguiente establece que una combinación de polinomios pri- 
mos relativos es igual al polinomio constante 1 . 

Teorema E.2. Si fi(x) y f L .(x) son polinomios primos relativos, existen polino- 
mios q,(x) y q 2 (x) tales que qi(x)fi(x) + q 2 (x)f,(x) = 1 , que es el 
polinomio constante de grado cero con valor 1. 

demostración. Sin pérdida de generalidad, supóngase que el grado de 
/i(*) es mayor o igual que el grado de f 2 (x). Utilizaremos inducción 
matemática sobre el grado de f 2 (x). Supóngase que f 2 (x) tiene grado 1. 
Por el Teorema E.l existen polinomios q(x) y r(x) tales que r(jc) tiene 
grado menor que 1 y que 

/,(*) = q(x)f 2 (x) + r(x). (4) 

Nótese que r(x) no puede ser el polinomio cero, puesto que /i(jc) y 
f 2 (x) son primos relativos. Por tanto, r(x) es una constante no nula c. 
Entonces la Ecuación (4) puede reescribirse como 

(c-’)/i(jr) + (-c)~'q(x)f 2 (x) = 1 . ( 5 ) 

Así, la conclusión vale con q t (x) = c' y q 2 (x) = (-c)-'q(x). Ahora 
supóngase que el teorema se cumple cuando f 2 (x) tenga grado menor que 
n para algún entero n > 2 y supóngase que f 2 (x) tiene grado n. Por el 
Teorema E.l existen polinomios q(x) y r(x) tales que r(x) tenga grado 
menor que n y 


U(x) = q(x)f 2 (x) + r(x). 


( 6 ) 
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Como /i(x) y f 2 (x ) son primos relativos, r(x) no es el polinomio cero. 
Si r(*) tiene grado cero, entonces r(x) es una constante no nula c, y 
obtenemos la Ecuación (5) como antes. Supóngase entonces que r(x) es 
de grado mayor que cero. Como r(x) tiene grado menor que n, podemos 
aplicar la hipótesis de inducción a f 2 (x) y a r(x), siempre que podamos 
demostrar que dichos polinomios son primos relativos. Supóngase lo con- 
trario; entonces existe un polinomio no nulo g(jr) que divide a f 2 (x) y 
a r(x). Luego, existen polinomios h A (x) y h 2 (x) tales que 

r(x) = g(x)h x (x) y f 2 (x) = g(x)h 2 (x). (7) 

Combinando las Ecuaciones ( 6 ) y ( 7 ), obtenemos 

fiM = [q(x)h>(x) + h y (x)]g(x), 

y entonces g(x) divide a fi(x). Pero g(x) divide a f 2 (x), contradiciendo 
el hecho de que U(x) y f 2 (x) son primos relativos, de modo que r(jt) y 
f 2 (x) son primos relativos. Por tanto, por la hipótesis de inducción, exis- 
ten gi(*) y g 2 (*) tales que 

gi(x)f 2 (x) + g 2 (x)r(x) .= 1. (8) 

Combinando las Ecuaciones ( 6 ) y ( 8 ), tenemos 

gi(x)f 2 (x) + g 2 (x)[f!(x) ~ q(x)f 2 (x)] = 1. 

De donde 

g 2 (x)f i(jt) + [gi(x) - g 2 (x)q(x)]f 2 (x) = 1. 

Haciendo q x (x) = g 2 (x) y q 2 (x) = gi(x) — g 2 (x)q(x) obtenemos la con- 
clusión deseada. ■ 

Ejemplo 1. Para los polinomios primos relativos fi(x) — x 2 (x — 1) y 
f 2 (x) = (x — 2)(x — 3), se verifica fácilmente que 

qi(x)fi(x) + q 2 (x)f 2 (x) = 1, 

donde 

qáx) = à(~ 7x + 23 ) y <?*(*) = -(* 2 + 5* + 6). 

A lo largo de los Capítulos 5, 6 y 7 consideramos operadores linea- 
les que son polinomios en algún operador particular T y matrices que son 
-polinomios en una matriz particular +. Para estos operadores y matrices 
es conveniente la siguiente notación. 

Definiciones. Sea 

f (x) = a 0 + ajx + ... + a n x n 

un poíinomio con coeficientes de un campo F. Si T es un operador lineal 
en V, un espacio vectorial sobre F, definimos f(T) mediante 

f(T) = a 0 l + aj + . . . + a u T n . 
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De manera análoga, si A es una matriz de n x n con elementos de F, 
definimos f(A) mediante 

f(A) — a 0 I + a^A + . .. + a n A n . 

Ejemplo 2. Sea T un operador lineal en R 2 definido mediante T (a, 6) = 
— (2 a + b, a — b) y sea f(x) = x 2 + 2x — 3. Como T 2 (a, b) — (5 a + b, 
a + 2b), 

/(T) (a, b) = (T 2 + 2T - 31) (a, 6) 

= (5a + b, a + 2Z?) + (4 a + 2 b, 2a — 26) — 3(a, 6) 

= (6a + 36, 3 a - 36). 


Análogamente, si 



entonces 


/(i4) = A 2 + 2A - 3/ = í j 2 




Los siguientes tres teoremas utilizan esta notación. 

Teo rema E.3. Sea f(x) un polinomio con coeficientes de un campo F, y sea T 
un operador lineal en V, donde V es un espacio vectorial sobre F. Entonces 

(a) f(T) es un operador lineal en V. 

(b) Si p es una base ordenada finita para V y A = [T]p, entonces 
[f(T-)]j3 = f(A). 

de m ostración . E j er cicio. 

Teorema E.4. Sea T un operador lineal en un espacio vectorial V sobre F, y sea 
A una matriz cuadrada con eiementos de F. Entonces, para polinomios 
cualesquiera f x (x) y f 2 (x), con coeficientes de F 

(a) +(T)f 2 (T) — f 2 (T)fi(T). 

(b) f x (A)f 8 (A) - f 2 (A)fi(A). 

demostración. Ejercicio. 

Teorema E.5. Sea T un operador lineal sobre un espacio veclorial V sobre un 
campo F, y sea A una maíriz de n x n con elemeníos de F. Si fi(x) y 
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f 2 (x) son polinomios primos relativos con elementos de F, entonces existen 
polinomios tji (x) y q 2 (x) con elemenlos de F tales que 

(a) qi(T)f a (T) + q 2 (T)f 2 (T) = I. 

(b) q a (A)f a (A) + q 2 (A)f 2 (A) = I. 

demostración. Ejercicio. 

En los Capítulos 5 y 6 nos interesa determinar cuándo un operador 
lineal T en un espacio vectorial dimensionalmente finito puede “diagonali- 
zarse”, así como encontrar una representación sencilla (canónica) de T. 
Ambos problemas son afectados por la factorización de un cierto polino- 
mio determinando por T (el “polinomio característico” de T). En este 
asunto tienen un pap>el importante algunas clases de polinomios. 


Definiciones. Un polinomio f(x) con coeficientes de un campo F, se llama 
mónico si su coeficiente principal (el de la potencia mayor) es 1. Si f(x) 
tiene grado positivo y no puede expresarse como un producto de polino- 
mios con coeficientes de F, cada uno de grado positivo, f(x) se denomina 
irreducible. 

Obsérvese que, el que un polinomio sea o no irreducible, depende del 
campo del que provengan sus coeficientes. Por ejemplo, f(x) = x 2 + 1 
es irreducible en el campo de Ios números reales, pero no Io es en el 
campo de los números complejos, puesto que x 2 + 1 = (x + i) (x — i). 

Evidentemente, un polinomio de grado 1 es irreducible. Más aún, para 
polinomios con coeficientes de un campo algebraicamente cerrado, los 
polinomios de grado 1 son los únicos polinomios irreducibles. 

Pueden establecerse fácilmente los siguientes hechos. 

Teorema E.6. Sean <f>(x) y f(x) polinomios con coeficientes de un campo F. 
Si <j> (x) es irreducible y <p(x) no divide a f(x), entonces <j>(x) y f(x) son 
primos relativos. 

demostración. Ejercicio. 

Teorema E,7. Cualquier par de polinonuos mónicos irreducibles disíintos son 
primos relativos . 

demostración. Ejercicio. 

Ahora estableceremos un resultado que conducirá a la demostración 
del teorema de factorización única para polinomios, el cual establece que 
todo polinomio de grado positivo es expresable de manera única como 
un producto de polinomios irreducibles mónicos multiplicado por una cons- 
tante. 
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Teorema E.8. Sean f(x), g(x) y </>(x) polinomios con coeficientes del mismo 
campo. Si </>(x) es irreducible y divide al producto f(x)g(x), entonces 
</>(x) divide a f(x) o </>(x) divide a g(x). 

demostración. Supóngase que no divide a f(x). Entonces </>(*) 

y f(x) son primos relativos por el Teorema E.6 y, por lo tanto, existen 
polinomios q x (x) y q 2 (x) tales que 

1 = qÁx)ỳ(x) + q 2 (x)f(x). 

A1 multiplicar ambos lados de la ecuación por g(x) se tiene 

g(x) = qi(x)<l>(x)g(x) + q 2 (x)f(x)g(x). (9) 

Como <j>(x) divide a /(jc)g(jc), existe un polinomio h(x) tal que 
f(x)g(x) = <f>(x)h(x). Y la Ecuación (9) se convierte en 

g(x) = qi(x)<j>(x)g(x) + q 2 (x)<f>(x)h(x) = 

= <t>(x)[qAx)g(x) + q 2 (x)h(x)]. 

Por lo que <f>(x) divide a g(*). ■ 

Corolario. Sean </>(x), </>i(x), </> 2 (x), . . . , </> n (x) polinomios mónicos irreduci- 
bles con coeficientes del mismo campo. Si <j>(x) divide al producto 
<t>i(x)<j> 2 (x) . . . <j> n (x), entonces </>(x) = </> ,(x) para alguna i(i = 1, 2,. . ., 
n). 

demostración. Demostraremos el corolario por inducción sobre n. Para 
n — 1 el resultado es una consecuencia inmediata del Teorema E.7. Su- 
póngase entonces que el corolario es cierto para cualesquier n — 1 poli- 
nomios mónicos irreducibles y que contamos con n polinomios mónicos 
irreducibles <j>i(x) 9 <f> 2 (x), . . . , <t> n (x). Si <j>(x) divide al producto 

<f> i(x)<j> 2 (x) . . . <j>n(x) \<t>i(x)<t> 2 (x) . . • </>n-l(**0 ]</>n(-*) > 

entonces, por el Teorema E.8, <j>(x) divide al producto </> i(x)<t> 2 (x) . .. 

. . . <j> n ~i(x) o <j>(x) divide a <f> n (x). En el primer caso <f>(x) = </>i(*) 
para alguna /(/ = 1, 2, ... , n — 1), por la hipótesis de inducción; en 
el segundo caso, por el Teorema E.7, <f>(x) = </> n (*). I 

Ahora ya somos capaces de establecer el teorema de factorización 
única, que se utiliza a lo largo de los Capítulos 5 y 6. 

Teorema E.9. (Teorema de factorización única para polinomios.) Para cual- 
quier polinomio f(x) de grado positivo , existen una constante única c, poli- 
rtomios mónicos irreducibles </>i(x), </> 2 (x), . . . , <f*k(x), y cnteros positivos 
únicos nu n 2 , . . . , n^ tales que 

f(x) = c[</>i(x)] n >[</> 2 (x)] n * . . . [</>&(x)] nk . 

demostración. Principiaremos demostrando la existencia de tal factori- 
zación utilizando inducción sobre el grado de f(x). Si f(x) es de gra- 
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do 1, entonces f(x ) = ax + b para algunas constantes a y b con 0. 
Haciendo $(x) = x + b/a , tenemos que /(jc) = a<f>(x). Como <£(*) es 
un polinomio mónico irreducible queda demostrado el resultado en este 
caso. Ahora supongamos que la conclusión es cierta para cualquier poli- 
nomio de grado positivo menor que algún entero n > 1 y sea f(x) un 
polinomio de grado n. Entonces 

f(x) = a n x n + . .. + a x x -f a 0 

para algunos escalares a^ con a n ^ 0. Si f(x) es irreducible, entonces 
f(x) =a n (x» + + ... + ?L X + fl) 

\ &n &n/. 

es una representación de f(x) como un producto de a^ por un polinomio 
mónico irreducible. Si f(x) no es irreducible, entonces f(x) = g(x)h(x) 
para algunos polinomios g(x) y h(x), cada uno de grado positivo menor 
que n. La hipótesis de inducción garantiza que g(x) y h(x) se factorizan 
como productos de una constante por potencias de diferentes polinomios 
mónicos irreducibles. Por lo tanto, f(x) = g(x)h(x) también se factoriza 
de este modo. Así pues, en ambos casos f(x) puede ser factorizado como 
un producto de una constante por potencias de polinomios mónicos irre- 
ducibles. 

Falta establecer la unicidad de tal factorización. Supóngase que 

f(x) = clMxmMx)]"' ■ ■ ■ (<f> k (x)] nt 

= d[Mx)] m '[Mx)] m ' ■ ■ ■ lir(x)] m ', (10) 

donde c y d son constantes, <f>ì(x) y f';(x) son polinomios mónicos irre- 
ducibles, y «j y son enteros positivos (/ = 1, 2, . . . , k y /' = 1, 2, . .. , 
r). Claramente se ve que tanto c como d deben ser el coeficiente principal 
de f(x); por lo tanto, c — d, y la Ecuación (10) se transforma en 

[<h(x)] n '[<h(x)]">... [<M*)] n ‘ = [M*)] m '[M*)] mî • • • (11) 

Así tenemos que <f> t (x) divide al Iado derecho de la Ecuación (11) para 
/ = 1, 2, ... , k. Consecuentemente, por el corolario del Teorema E.8, 
para cada /(/ =1,2 , . .. , k) <f>i(x) = ýj(x) para alguna / = 1 , 2, . .. , r, 
y para cualquier /'(/ =1,2 , . .. , r) <f/j(x) = <f>i(x) para alguna / = 1, 
2, ... , k. Concluimos que r ~ k y que, renumerando en caso de ser 
necesario, <{>i (x) = <f ,(x) para / = 1, 2, . .. , k. Supóngase que n-, -+ m-, 
para alguna /. Sin perder generalidad podemos suponer que / = 1 y 
«! > m t . Entonces, eliminando [</>,(*) ] mi de ambos lados de la Ecua- 
ción- (11) tenemos \ 

[<t>i(x)ì n '- m '[<t> 2 (x)] n ? . . . [<f>u(x)] n > = [<j> 2 (x)] m > . . . [<f> k (x)] m ‘. (12) 

Como n> - m>> 0, Mx ) divide a la parte izquierda de la Ecuación (12) 
y P°r tanto también divide al lado derecho. Así, ^+x) = f+x) para al- 
guna / = 2, ... , k, por el corolario al Teorema E.8. Pero esto contradice 
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el hecho de que <£iU), <f> 2 (x), . .. , <j>k(x) son distintos. Por lo tanto, las 
factorizaciones de f(x) en la Ecuación (10) son las mismas. ■ 

Es a menudo útil considerar un polinomio f(x) = OnX n + . .. + 
+ a x x + a 0 con coeficientes del campc F como una función /: F F. 
En este caso, el valor de / en c ÇF es /(c) = OnC n + ... + a x c + a 0 . Des- 
afortunadamente, para campos cualesquiera F, no existe correspondenda 
uno-a-uno entre polinomios y funciones polinomiales. Por ejemplo, si 
f(x) = x 2 y g(x) = x son dos polinomios del campo Z 2 (como se defi- 
nió en el Ejemplo 4 del Apéndice C), entonces f(x) y g(x) tienen grados 
diferentes y, por lo tanto, no son iguales como polinomios. Pero f(a) = 
= g(a) para toda a ÇZ 2 , y así / y g son funciones polinomiales iguales. 
Nuestro resultado final muestra que esta anomalía no puede ocurrir si F 
es un campo infinito. 

Teorema £.70. Seart f(x) y g(x) polinomios con coeficientes de un campo in- 
finito F. Si f(a) = g(a) para toda a £F, entonces f(x) y g(x) son iguales. 

demostración. Supóngase que f(a) = g(a) para toda a£F. Defínase 
h(x) = f(x) — g(jc) y supóngase que h(x) es de grado n > 1. Se tiene 
del corolario al Teorema E.9 que h(x) puede tener como máximo n ceros. 
Pero h(a) = f(a) ~ g(a) = 0 para cualquier aÇ_F contradiciendo la hi- 
pótesis de que h(x) tiene grado positivo. Así, h(x) es un polinomio cons- 
tante y como h(a) =0 para cada aÇF se tiene que h(x) es el polinomio 
cero. Por lo tanto, f(x) — g(x). ■ 



Respuestas a ios ejercicios 
seleccionados 


SECCION 1.1 


1. Sólo los pares de los incisos (b) y (c) son paralelos. 


2. 

(a) 

(c) 

(3, -2, 4) + í( — 8, 9, - 
(3, 7, 2) + /(0, 0, -10) 

3) 

3. 

(a) 

(2, -5, -1) + u( — 2, 9, 

7) + / 2 ( — 5, 12, 2) 


(c) 

(-8, 2, 0) +/,(9, 1,0) 

+ 4(14, -7, 0) 

SECCION 

1.2 


1. 

(a) 

V (b) F (c) F 

(d) F (e) V 


(g) 

F (h) F (i) V 

(j) V (k) V 

3. 

m 13 

= 3, M 2 1 = 4, y M 22 = 5 


4. 

(a) 

( 6 3 2\ 

l“4 3 9) 

(c) /8 20 -12 

\4 0 28 


(e) 

2* 4 + * 3 + 2x- - 2x + 10 


(g) 10x 7 - 30x 4 + 40x 2 - 15* 

13. No, (VS 4) falla. 

14. Sí. 

15. No. 

SECCION 1.3 

1. (a) F (b) F (c) V (d) F (e) V 

2. (a) ^ 2 — 1 ^’ traza es ~5. 


(f) F 
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(c) /-3 0 6\ 

l 9 -2 ij 


(e) 


n 

-ì 

3 


11. No, el conjunto no es cerrado bajo la adición. 
14. Sí. 


SECCION 1.4 


1. 

(a) 

V (b) 

F 

(c) 

i V 

(d) 

F 

(e) 

V 

(f) F 

2. 

(a) 

{**(!, 1,0, 

0) + 

*,(- 

-3,0, 

-2, 1) 

i + (5, 0, 4, 

0): 

x 2 , £R) 


(c) 

No hay soluciones. 







(e) 

{X3(10, -3 

, 1, o. 

0) 

F ^-4 ( 

-3, 2, 

0, 1, 0) + ( 

-4, 

3, 0, 0, 5): x 3 , x 4 












3. 

(a) 

Sí. (c) 

No. 


(e) 

No. 





4. 

(a) 

Sí. (c) 

Sí. 


(e) 

No. 





SECCION 

1.5 









1. 

(a) 

F (b) 

V 

(c) 

F 

(d) 

F 

(e) 

V 

(f) V 

5. 

{(i 

0\ /0 0 
0 /V° 1. 

)} 








SECCION 

1.6 









1. 

(a) 

F (b) 

V 

(c) 

F 

(d) 

F 

(e) 

V 

(f) F 


(g) 

F (h) 

V 

(i) 

F 

(j) 

V 

(k) 

V 

(1) F 

2. 

(a) 

Sí. (c) 

Sí. 


(e) 

No. 





3. 

(a) 

No. (c) 

No. 


(e) 

No. 





4. 

No. 










5. 

No. 










8. 

{-*!> ^ 

+ *5, x 7 ) 










9. («j, a 2 , a 3 , a t ) = a^ + ( a 2 — a t )x 2 + (a 3 — a 2 )x 3 + (a 4 — a 3 )x. t 
10. dim(W t ) = 3, dim(W 2 ) -- 2, dim(W 1 l+ W 2 ) = 4, y dim(W, n W 2 ) = 1 
17. n 2 - 1 
19. ìn(n - 1) 

SECCION 1.7 

1. (a) F (b) F (c) F (d) V (e) V (f) V 
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SECCION 2.1 

1. (a) V (b) F (c) F (d) V (e) V (f) F 
(g) F (h) V (i) F 

2 . La nulidad es 1, y el rango es 2. T no es uno auno pero es sobreyectiva 

4 . La nulidad es 4, y el rango es 2. T no es ni uno auno ni sobreyectiva 

5 . La nulidad es 0, y el rango es 3. T es uno a uno pero no sobreyectiva 

10 . T(2, 3) = (5, 11). T es uno a umo 

12 . No. 


SECCION 2.2 



3 . 


(c) F (d) V (e) V (f) F 


_ ì 
7 


m*= o 


2 

7 


-1\ 

1 

0/ 


y ra = 



5. (a) 

í l 

0 

0 

°ì 

(b) 

(° 

1 

°ì 

(e) 

l \ 


o 

0 

1 

0 

. 

2 

2 

2 


~2 


0 

1 

0 

°J 


0 

0 

°l 


o 


io 

0 

0 

1 J 


io 

0 

2/ 

! 

i 4/ 


/' 

o 


o o 1 


°\ 

0 


0 0 0 ••• 1 
0 0 ••• l/ 


SECCION 2.3 


1. (a) F (b) 

V 

(c) 

F 

(d) 

V' (e) 

(g) F (h) 

F 

(i) 

V 

(j) 

V 

2 

/20 

-9 

18 \ 



A{2B + 3C) = 

(5 

10 

») 

y 

A{BD) = 


(f) F 


(- 2 ) 
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/2 3 0\ /11 0\ 

m/. = ( 0 3 6 ), [U]J = [ 0 0 1 ], 

\0 0 4/ V1 — 1 0/ 



(c) (5) 


(b) No. 


(2 6 6 \ 
y [ut]; = ( o o 4 ) 
\2 0 - 6 / 


SECCION 2.4 

1. (a) F (b) V (c) F (d) F (e) V (f) F 

(g) V (h) V (i) V 

17. (b) 0 0 0\ 

0 0 10 
0 10 0 
\o 0 0 1/ 


SECCION 2.5 


1- (a) F (b) V (c) V (d) F (e) V 



3 . (a) /a 2 b 2 c 2 \ (c) /0 -1 0\ (e) 

laibtcA í 1 0 0 ) 

\®o b 0 c 0 / \ — 3 2 1/ 

4 - (a) / 3 -1\ / 5 —4\ 

v y -0 





SECCION 2.6 

1. (a) F (b) V (c) V (d) V (e) F (f) y 

(g) V (h) F 

2 . Las funciones de los incisos (a), (c), (e) y (f) son funciones lineales. 

3 . (a) L(jc, y, z) — x — iy, t 2 (x, y, z ) — iy, y i 2 (x, y, z) — —x + z 
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5. La base para V es {p i(x), p 2 (x)j, donde Pi(x) = 2 — 2x y 
p 2 (x) = — i + x. 


7. 

(a) 

T‘(f) 

= g, 

donde g(a -f bx) ~ 

- — 3a - 4 b 



(b) 

[t'k; 

-( 

=ì 0 


(c) m; = ( 

-! '!) 

SECCION 

2.7 






1. 

(a) 

V 

(b) 

V (c) 

F 

(d) F (e) 

V (f) 


(g) 

V 






2. 

(a) 

F 

(b) 

V (c) 

V 

(d) V (e) 

F 

3. 

(a) 

{«"*. 

/«-•} 

(c) {<r‘, te ', 

e\ te') 



(e) 

{«"*. 

e l cos 2t , e* sen 

2t) 



4. 

(a) 

^UWT)t/ 2^ 

e d-v/yof/2j 

(c) 

{1, <r“, e- 2 '} 



SECCION 

1. (a) 

3.7 

V 

(b) F 

(c) 

V 

(d) F 

(e) V 

(f) 

(g) 

V 

(h) F 

(i) 

V 





2. Anadiendo —2 veces la columna 1 a la columna 2 transforma A en B. 


SECCION 

3.2 





1. 

(a) 

F 

(b) 

F 

(c) 

V 


(g) 

V 

(h) 

V 

(i) 

V 

2 . 

(a) 

2 

(c) 

2 

(e) 

3 

4 . 

(a) 


/1 

0 0 

°\ 




D -- 

= 0 

1 0 

°); 

el r: 




Vo 

0 0 

0/ 


5 . 

(a) 

E1 

rango es 2, y 

la inversa 


7 . 


(d) V (e) F (f) V 
(g) 1 


C! =î) 

/ b i\ 

(c) E1 rango es 3 y la inversa es I i 0 — i 

W i í 

(e) E1 rango es 3; por lo que no existe inversa. 

(a) T ^(ax- + bx + c) = —ax 2 — (4 a + b)x — (10a + 2 b + c) 
(c) T'^ax- + bx + c) = (a, — \b + ic, —a + ib + ic) 

/1 0 0\/l 0 0\/l 0 0\/l 2 0\/1 0 0\/l 

[ 0 1 0 )( 1 1 0 )( 0 -2 0 ( 0 1 0 ( 0 1 o )( 0 

Vl 0 l/Vo 0 1 /Vo 0 l/Vo 0 l /\0 -1 
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SECCION 3.3 



7. Los sistemas de los incisos (b), (c) y (d) tienen soluciones. 

10. E1 agricultor, el sastre y el carpintero deben de tener ingresos en las pro- 
porciones 4: 3: 4. 

11. Deben de tener 7.8 unidades del primer bien y 9.5 unidades del segundo. 

SECCION 3.4 

1. (a) F (b) V (c) V (d) V (e) F (f) V 

(g) V 



(c) No hay soluciones. 


SECCION 4.1 

1. (a) V (b) F (c) V (d) F (e) V (f) F 

2. (a) 30 (c) -8 
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3. (a) -10+15i (c) -24 

4 . (a) 19 (c) 14 

SECCION 4.2 

1. (a) V (b) V (c) F (d) F (e) V (f) F 

3. (a) -34 (c) -49 

4 . Las funciones en los incisos (c), (d) y (g) son 3— lineales. 


SECCION 4.3 


1 . 

(a) 

V 

(b) V 

(c) F 

(d) 

V 

(e) F (f) V 


(g) 

F 

(h) V 

(i) .V 

(j) 

F 

(k) V 

2: 

(a) 

90 

(c) 0 





3 . 

(a) 

100 

(c) 0 

(e) 

86 

(g) 

-180 + 40i 


SECCION 4.4 

1. (a) F (b) F (c) F (d) F 

2 . (a) f A 22 -A lt \ (c) / - 3 / 0 0 \ 

\ A 2i A u J I 4 — 1 + / 0 | 

\10 + 16/ — 5 — 3/ 3 + 3i/ 

(e) / 6 22 12\ / 18 28 -6\ 

( 12 -2 24 ) (g) ( -20 -21 37 ) 

\21 -38 -27/ \ 48 14 -16/ 

3. (a) bíû 22 b 2 cii 2 b 2 Q u b : a 21 

*1 =-, x 2 =- 

Q 11 Q 22 Q 12 Q 21 Q 11 Q 22 Q 12 Q 21 

(c) x x = — 1, x 2 = —1.2, x 3 = —1.4 
(e) Xi = —43, x 2 = —109, x 3 = —17 


SECCION 4.5 

1. (a) V (b) V (c) F (d) F (e) V (f) V 

2. (a) -1 (c) (— 1 )«(«+D /2 

(e) (-l)"- 1 


SECCION 4.6 

1. (a) V (b) V (c) V (d) F (e) F (f) V 

(g) V (h) F (i) V (j) V (k) V 
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2 . 

(a) 

22 (c) 2 - 4/ 



3 . 

(a) 

-12 (c) 22 (e) 

-3 


4. 

(a) 

88 (c) -6 (e) 

17 - 3/ 

(g) 24 + 24/ 

SECCION 5.1 



1. 

(a) 

F (b) V (c) V (d) F 

(e) F (f) F 


(g) 

F (h) V (i) \ 

r (j) F 

(k) F 

2 . 

Q = 

(-i "!) 'H 

' 6 11\ 
"2 -V 


3 . 

(a) 

Los eigenvalores son 4 y 

— 1, y una base de eigenvectores es 



IG)(-!): 

• e = l 

(2 1\ 

-i y 


(c) 

Los eigenvalores son 1 y 

— 1, y una base de eigenvectores es 



((.'.X-.'-O 

(}• e = 

(i-/ -i-i)- 

4. 

Los eigenvalores son 1, 2 y 3, ; 

y una base de eigenvectores es (1, x, x 2 } 

SECCION 5.2 



1. 

(a) 

F (b) F (c) V 

(d) F 

(e) F (f) V 


(g) 

V (h) F (i) V 



2 . 

(a) 

No diagonalizable. 

(c) e = 

(! -i) 


(e) 

No diagonalizable. 

(g) 

/ 1 i i\ 




Q = 

í 2 -! °) 

\-l 0 1/ 

3 . 

(a) 

No diagonalizable. 

(c) No diagonalizable. 

9. 

A n 

/5“ 2( —l) n 2(5”) 

3 3 3 

= 5 n (-1)” 2(5 n ) 

3 3 3 

2(-l)"\ 

3 

. (-D n 

3 / 



16. X{t) = ^ + c 2 e 2í 
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SECCION 5.3 






1- (a) 

V 

(b) 

V 

(c) 

F (d) F (e) 

V (f) V 

(g) 

V 

(h) 

F 

(i) 

F (j) V 


2. (a) 

(0 



(c) 

/J_ J_\ ( e > 

No existe límite. 


(o 

oj 



/13 13 \ 

\ 6 — J 







\ 13 13 / 


(g) 

/ 

-1 0 

-V 

Ui) 

No existe límite. 



(-4 1 - 2 ) 

\ 2 0 2 / 


6 . Un mes después de su llegada 25% de los pacientes se han recuperado, 
20% son ambulatorios, 41% están en cama y 14% han muerto; eventual- 

mente -ii se recuperan y mueren. 

7. i 

8 . Sólo las matrices de los incisos (a) y (b) son matrices regulares de tran- 
sición. 


9. (a) 



10 . (a) 


' 0.225 N 
0.441 
s 0.334/ 


(c) No existen límites. 


(e) 

/o 

0 

°\ 

(g) 

í° 

0 

0 

0\ 


(i 

1 

o) 


lo 

0 

0 

0 


\i 

0 

1/ 



i 

1 

0 





1 


i 

0 

1/ 


después de dos etapas y eventualmente 



(c) 


(e) 



después de dos etapas y eventualmente 


después de dos etapas y eventualmente 



12. -^- nuevas, J\ utilizadas una vez y — utilizadas dos veces. 

13 . En 1985 24% poseerán autos grandes, 34% poseerán autos de tamano me- 
diano y 42% poseerán autos pequenos; las proporciones en un tiempo cual- 
quiera son 0.10, 0.30 y 0.60. 

18 . e° — I y é — el. 
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SECCION 5.4 

1. (a) F (b) V (c) V 

2 . Los subespacios de los incisos (a), (c) y (d) son T-invariantçs. 


SECCION 5.5 


1 . 

(a) 

F 

(b) F (c) V 

(d) V 

(e) V 

2 . 

(a) 

{Ci, 

^2? ^3? ^ 4 } 

(c) 

{(? ï)l 

3. 

(a) 

(i) 

-t(l - t)(f- - 3t + 3) (ii) 

-í(l - t)(t- - 3/ + 3) 


(c) 

(i) 

1 - t 

(ii) 

(t - 1 ) 3 (/+ 1 ) 

SECCION 5.6 




1 . 

(a) 

F 

(b) V (c) F 

(d) F 

(e) V (f) F 


(g) 

F 

(h) V 


2 . 

(a) 

(t~ 

■ l)(í - 3) 

(c) (t — 

l) 2 (i- 2 ) 

3. 

(a) 

(t- 

2)3 

(c) (t - 

!)(*■+ 1 ) 

5 . 

Los operadores diagonalizables en 

R 2 que satisfacen a T 3 — 2T 2 + T 


son To, I y aquellos operadores que tengan a 0 y a 1 como eigenvalores. 


SECCION 6.1 

1 . (a) V (b) F (c) F (d) V (e) F (f) F 

(g) V (h) V 

2. (a) Para A. = 2, 



es una base para Ea; cualquier base para R 2 es una base para Ka. 
(b) Para A = — 1, 



es una base para Ea y Ka. 
Para X = 2, 
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es una base para E,\ y 



es 

SECCION 

6.2 

1 . (a) 

V 

(g) 

F 

2 . /2 

1 

(0 

2 

\o 

0 


es una base para K\. 


(b) V 
(h) V 



(c) F (d) V (e) V 


© (o 2 ) 0 (2) 0 J 1 ^ © (4) © ( 


3 . (a) -(*- 2) s (í- 3 ) 2 

(b) Para = 2 


Para A, = 3 


( 

(c) A 2 = 3 

(d) Pi = 3 y p 2 = 1 

(i) rangotUO = 3 y rango(U,) = 0 

(ii) rango(U;) == 1 y rango(Up = 0 

(iii) nulidad(U!) = 2 y nulidad(U 2 ) = 2 

(iv) nulidad(U;) = 4 y nulidad(U 2 ) = 2 


(e) 


(a) | 


0 

-°\ 


7 = 

0 

2 

1 

! 


(0 

0 

2! 


(d) 

/0 

1 

0 

0 \ 

7 = 

0 

0 

0 

0 


ò’ 

” 0 ” 

" 2 " 

”0 


\0 

0 

0 

2 / 


y Q 


6 . La forma canónica de Jordan es 


/! 

1 

= 2 

1 

\l - 

1 



II 

Oì 

1 


1 



es 


n 1 ° | 

°\ 

0 1 1 i 

0 

0 0 1 

0 

0 

0 

0 

”2/ 



y una base canónica de Jordan es {2e*, 2xe', x-e r , e 2 *}. 


(f) V 

-3) © (-3) 
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SECCION 6.3 


1. (a) 

V 

(b) 

F 

(c) F 

(d) 

V (e) 

F 


(f) 

V 

(g) 

F 










2. (a) 

/° 

0 

27\ 



(b) / 

'0 

—1> 

\ 



( 1 

0 - 

27 ) 



( 


-l y 




\o 

1 

9/ 








(c) 

/i(- 

-1 + 

/\ / '3) 

0 

\ 

(e) 


-2 

0 

o\ 



0 


i(-l - 

/V3); 


1 

0 

0 

0 








ò" 

0 

0 

-3 








\o 

0 

1 

0/ 


SECCION 7.1 


1. 

(a) V (b) 

V 

(c) F (d) F (e) F (f) F 


(g) V (h) 

F 

(i) V 

2. 

(x, y) = 4 + i, 

IMI = 

V~, ||y|| = VlL y \\x + y|| 2 = 37. 

3. 

(f,g) = h ll/ll 

ii 

11*11=^. 


y ||/ + *||= yii+if! 


SECCION 7.2 


1 . 

2 . 


4. 

5. 


(a) 

(b) 


(c) 


F (b) V (c) V (d) F (e) V (f) V 
La base ortonormal es 




1 , 1 ), 


V6 


(- 2 , 1 , 1 ), 


V 2 


( 0 , 



Los coeficientes de Fourier son 2V3/3, — V6/6, y V2/2. 
La base ortonormal es {1, 2*J T(x — £), 6^/7(x 2 — x + £)}. 
Los coeficientes de Fourier son 3/2, yT/6 , y 0. 


^ = i(l -0, “1)}. 


En el primer caso, S -L es el plano que pasa por el origen que es perpen- 
dicular a x 0 ; en el segundo caso S -L es la recta que pasa por el origen 
que es perpendicular al plano que contiene a y x 2 . 
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5ECCION 7.3 

1 . (a) V (b) F (c) F (d) V (e) F (f) V 

(g) V 

2. (a) y=(l, -2, 4) (c) >-= 210x 2 - 204 a: + 33 

3. (a) T*(jc) = (11, -12) (c) T(/(x)) = 7x 2 + x + 12 

14 . T*(*) = (x, z)y 

SECCION 7.5 

1. (a) V (b) F (c) F (d) V (e) V (f) V 

(g) F (h) V 

2 . (a) T es autoadjunto; la base ortonormal es <—=( 1, — 2), -^=;(2, 1) 

l V 5 V 5 

(b) T es normal pero no autoadjunto. 

(c) T no es normal. 


SECCION 7.6 


1 . (a) F (b) V (c) V (d) F (e) F 

2. (a) VÏ 8 (c) 2 

4 . (a) ||/1|( 84.74, ||+- 1 || ír 17.01, y cond(+) 1441 

(b) i|3c-+- i 6||<iM- , iMI^-*ll^-i 7 y 


x-A-'b || ^ coni(i) W b L^lMl 

||^-i6||.-^ cond (A> ii * || II h\\ 


5 . 0.001 < 


R -2 = y. 


SECCION 7.7 


|5|| = 2, y cond(B) = 2 


1. (a) V (b) F (c) F (d) V (e) F 

(g) F (h) F (i) F 


2. (a) 


1 í\ 


(ì -!) 1 D= (o ->) 


(f) v 



532 Respuestas a los ejercicios seleccionados 


(d) 


P = 


1 


V 2 
1 


1 1 

V~6 V"3" 

1 1 


V 2 
0 


V 6 V 3 
2 1 


( 1 0 °\ 

Z) = ( 0 1 0 ) 

\0 0 4/ 


V 6 V 3 

4 . T* es normal para toda zÇ C; T, es autoadjunto si y sólo si zÇ Z?; T z es 
unitario si y sólo si z =1. 

5. Solamente el par de matrices en el inciso (d) es unitariamente equivalente. 

21 . (c) 



7T 

i 

7T 

\ 

6 


fTT 

7T 

2 \ 
\í^ 

Ô = 

! i 

1 

"7T 


y « = 

0 

1 

7T 

71 

3 


1 0 

1 

7T 



l 0 

0 

71 

3 / 

x t = 

3, ^ 

-5, x 3 

= 4 






22 . (a) x = —j=-*' + -~y' y y = —Ux' — -i—y' 

V2 V2 V 2 V2 

La nueva forma cuadrática es 3(x') 2 — (y') 2 . 

SECCION 7.8 


1. (a) F 
(g) F 

3 


(b) V (c) V 

(h) V (i) V 


(d) F 
(j) F 


(e) V (f) F 

(ft) V (i) V (j) F 
■ {<+ «■} 

{<;> ■<*}**■• * ■<>}« 


4. (b) 


'cos <l> — 
sen <j> 

7. (c) Se tienen seis posibilidades: 

0) Cualquier recta que pase por el origen si <f> = f = 0. 

(u) 

I 

si (f) — 0 y ý — 77. 


$¥= o 


t e R 


(iii) 



/ e R\ 


si </> — 7T y xj/ 7r. 
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(ÇR 


SÌ if/ — 7r y <j> 


SÌ <l> — ij/ — ir. 


(vi) 


'sen <£(cos f + 1)\ 
— sen <j> sen ij/ J: 
<sen if /(cos <j> + 1)/ 


t<=R 


para cualquier otra 
posibilidad. 


SECCION 7.9 

1. (a) F (b) V (c) V (d) V (e) V (f) F 

2. ParaWi=L({(l,2)}), [T]„ = (| 

3. (ii) (a) T x (o, b ) = i(u + b, a + b) y T i .(o, b) = i(o - b, -a + b) 

(d) Lío, b, c) = i(2o - b - c, -ct + lb- c, 

—a — b + 2c) y T 2 (o, b, c) = i(o + b + c, o + b + c, 

o + b + c) 


SECCJON 7.J0 


2. La parábola esy = — — — + 2, y el error es 0. 

3. x = ì,,y = ì„z = \ 


SECCION 7.11 


1 . 

(a) 

F 

(b) 

F (c) V 

(d) 

F 

(e) 

V 

(f) 

F 



(g) 

F 

(h) 

F (i) V 

(J) 

F 







4. 

(a) 

Sí. 

(b) 

No. (c) 

No. 

(d) 

Sí. 

(e) 

Sí. 




(f) 

No. 












5. 

(a) 

/° 

2 - 

2 \ (b) 

fi 

0 0 

o 

(c) 


° 

0 

0 

0 



( 2 

0 - 

2 ) 

0 

0 0 

0 



-1 

0 

-4 

0 



\1 

1 

0 / 

0 

0 0 

0 



o 

0 

0 

0 






il 

0 0 

1/ 



1-2 

0 

-8 

0/ 



534 Respuestas a los ejercicios seleccionados 


22. (a) 


2 \ 

1 \ 

77 


1 ’ 

2 

VT/ 

vT/ 


(b) La misma que (a). 


23. 

33. 


(c) 

r 

1 ì 


f # \ 



0 

> 

1 



1 j 

VI/ 


1°/ 

Igual que 22 (c). 



(a) 

Ô = 

r 


y 

(b) 

ô = 

r 

!) 

y 

(c) 


/0 o' 


ì 


(2 = 1 

0 , 

— 

0.25 



\I 0 


2 


1 \ 

0 

1 

JTÌ 



/-1 0 0 
y D = í 0 4 0 

\ 0 0 6.75 
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